03.01.2015 Views

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Annamaria Mazzia<br />

<strong>Note</strong> <strong>di</strong> <strong>Analisi</strong> <strong>Matematica</strong> 2<br />

Università <strong>degli</strong> Stu<strong>di</strong> <strong>di</strong> Padova<br />

corso <strong>di</strong> laurea in Ingegneria E<strong>di</strong>le-Architettura<br />

a.a. 2012-2013<br />

Questo lavoro è pubblicato sotto una Creative Commons Attribution-Noncommercial-No<br />

Derivative Works 2.5 Italy License,<br />

(http://creativecommons.org/licenses/by-nc-nd/2.5/it/)


In<strong>di</strong>ce<br />

In<strong>di</strong>ce<br />

iii<br />

1 Brevi richiami <strong>di</strong> analisi 1 1<br />

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . 2<br />

1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />

1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

2 Funzioni reali <strong>di</strong> più variabili 7<br />

2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . 9<br />

2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . 13<br />

3 Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni <strong>di</strong> più variabili 17<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4 Massimi e minimi 35<br />

4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . 47<br />

4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

iii


INDICE<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . 52<br />

5 Le curve 57<br />

5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

6 Superfici parametriche 83<br />

6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . 87<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . 87<br />

7 Integrali 91<br />

7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . 91<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . 92<br />

7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />

7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />

7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />

7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />

7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

8 Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie 119<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />

8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . 122<br />

8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . 123<br />

iv


In<strong>di</strong>ce<br />

8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . 126<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />

8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />

8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />

8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />

8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . 132<br />

8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

9 Forme <strong>di</strong>fferenziali 139<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />

9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . 144<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />

Bibliografia 151<br />

v


CAPITOLO 1<br />

Brevi richiami <strong>di</strong> analisi 1<br />

La teoria attrae la pratica<br />

come il magnete attrae il ferro.<br />

Carl Friedrich Gauss<br />

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . 2<br />

1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />

1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

1.1 Introduzione<br />

Quando si descrivono teoremi, si danno definizioni o, semplicemente, si <strong>di</strong>scute <strong>di</strong><br />

matematica, è abbastanza usuale prendere in prestito lettere dell’alfabeto greco.<br />

È importante, quin<strong>di</strong>, saperle riconoscere e chiamarle in maniera corretta:<br />

A α Alfa N ν Nu<br />

B β Beta Ξ ξ Xi<br />

Γ γ Gamma O o Omicron<br />

∆ δ Delta Π π Pi<br />

E ɛ Epsilon P ρ Rho<br />

Z ζ Zeta Σ σ Sigma<br />

H η Eta T τ Tau<br />

Θ θ Theta Υ υ Upsilon<br />

I ι Iota Φ φ Fi<br />

K κ Kappa X χ Chi<br />

Λ λ Lambda Ψ ψ Psi<br />

M µ Mu Ω ω Omega<br />

1.2 Identità trigonometriche<br />

Nel seguito introduciamo alcune formule trigonometriche, con la notazione:<br />

G sin (x) ≡ seno(x), cos (x) ≡ coseno(x),<br />

sin (x)<br />

G tan (x) ≡ tangente(x) =<br />

cos (x) , sec (x) ≡ secante(x) = 1<br />

cos (x) ,<br />

1


1. BREVI RICHIAMI DI ANALISI 1<br />

cos (−θ) = cos (θ)<br />

cos ( π 2<br />

− θ) = sin (θ)<br />

sin<br />

cos ( π 2<br />

+ θ) = − sin (θ)<br />

sin<br />

cos (π − θ) = − cos (θ)<br />

cos (π + θ) = − cos (θ)<br />

cos (θ + φ) = cos (θ) cos (φ) − sin (θ) sin (φ)<br />

sin (2θ) = 2 sin (θ) cos (θ)<br />

sin 2 (θ) + cos 2 (θ) = 1<br />

sin (−θ) = − sin (θ)<br />

( π<br />

2<br />

− θ) = cos (θ)<br />

( π<br />

2<br />

+ θ) = cos (θ)<br />

sin (π − θ) = sin (θ)<br />

sin (π + θ) = − sin (θ)<br />

sin (θ + φ) = sin (θ) cos (φ) + cos (θ) sin (φ)<br />

cos (2θ) = cos 2 (θ) − sin 2 (θ)<br />

tan 2 (θ) + 1 = sec 2 (θ)<br />

1.3 Regole su funzione esponenziale e logaritmica<br />

Assumiano a, b ∈ R, con a > 0 e b > 0. Si ha:<br />

1 x = 1<br />

a x+y = a x a y<br />

a xy = (a x ) y<br />

a log a (x) = x a 0 = 1<br />

a x−y = a x /a y<br />

a x b x = (ab) x<br />

log a (xy) = log a (x) + log a (y) log a (x/y) = log a (x) − log a (y)<br />

log a (x y ) = y log a (x)<br />

log a (a x ) = x<br />

log b (x) = log a (x)<br />

log a (b)<br />

b x = a x log a (b)<br />

1.4 Derivate e integrali<br />

Siano f e g due funzioni <strong>di</strong>pendenti dalla variabile reale x mentre c ∈ R sia una costante.<br />

In<strong>di</strong>chiamo la derivata <strong>di</strong> f con il simbolo df<br />

dx o me<strong>di</strong>ante f ′ . Si ha:<br />

d (cf)<br />

d x = cf ′ regola della costante<br />

d (f + g)<br />

= d f<br />

d x + d g<br />

d x<br />

regola della somma<br />

d x<br />

d (f/g)<br />

= f ′ g − fg ′<br />

d x g 2 regola del quoziente<br />

d (fg)<br />

d x = fg′ + f ′ g regola del prodotto<br />

d f r<br />

d x = rf r−1 f ′<br />

regola della potenza<br />

Tra le regole <strong>di</strong> integrazione, invece, ricor<strong>di</strong>amo quella <strong>di</strong> integrazione per parti:<br />

∫<br />

∫<br />

fg ′ dx = fg − f ′ g dx<br />

Diamo ora una tabella delle derivate e <strong>degli</strong> integrali delle funzioni più note (per gli integrali<br />

lasciamo fuori la costante <strong>di</strong> integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x),<br />

arccos(x) ≡ arcocoseno(x), cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), arccot(x) ≡,<br />

arcocotangente(x).<br />

2


1.5. Altri teoremi<br />

f f ′ f f ′<br />

1<br />

ln(x)<br />

e x e x<br />

x<br />

sin (x) cos (x) cos (x) − sin (x)<br />

1<br />

tan (x)<br />

cos 2 (x) (= sec2 (x)) cot (x) − 1<br />

sin 2 (x)<br />

1<br />

1<br />

1<br />

1<br />

tan (x)<br />

− cot (x)<br />

cos (x)<br />

cos (x)<br />

sin (x)<br />

sin (x)<br />

1<br />

1<br />

arcsin (x) √ arccos (x) −√ 1 − x<br />

2<br />

1 − x<br />

2<br />

1<br />

arctan (x)<br />

1 + x 2 arccot(x) − 1<br />

1 + x 2<br />

f<br />

x r x r+1<br />

∫<br />

fd x f<br />

∫<br />

fd x<br />

r + 1 (r ≠ 1) x−1 ln |x|<br />

e x e x ln |x| x ln |x| − x<br />

sin (x) − cos (x) cos (x) sin (x)<br />

tan (x)<br />

1<br />

ln | |<br />

cos (x)<br />

cot (x) ln | sin (x)|<br />

1<br />

cos (x)<br />

1<br />

ln |<br />

cos (x) + tan (x)| 1<br />

sin (x)<br />

1<br />

ln | + cot (x)|<br />

sin (x)<br />

1<br />

cos 2 (x)<br />

tan (x)<br />

1<br />

sin 2 (x)<br />

− cot (x)<br />

tan (x)<br />

cos (x)<br />

1<br />

cos (x)<br />

cot (x)<br />

sin (x)<br />

− 1<br />

sin (x)<br />

arcsin (x) x arcsin (x) + √ 1 − x 2 arccos (x) x arccos (x) − √ 1 − x 2<br />

arctan (x) x arctan (x) − 1 2 ln (1 + x2 ) arccot(x) xarccot(x) − 1 2 ln (1 + x2 )<br />

1<br />

1<br />

√ arcsin (x)<br />

1 − x<br />

2<br />

1 + x 2 arctan (x)<br />

1.5 Altri teoremi<br />

Richiamiamo, nel seguito, alcuni teoremi.<br />

Utilizzeremo, inoltre, le seguenti notazioni per funzioni <strong>di</strong> una sola variabile definite in un<br />

insieme X ⊂ R. L’insieme delle funzioni continue in X verrà denotato con il simbolo C(X).<br />

L’insieme delle funzioni continue in X, che hanno le prime n derivate pure esse continue,<br />

sarà in<strong>di</strong>cato con C n (X).<br />

3


1. BREVI RICHIAMI DI ANALISI 1<br />

Teorema 1.5.1 (<strong>di</strong> Rolle) a<br />

Sia f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[.<br />

Se f(a) = f(b) = 0, allora esiste un punto<br />

ξ ∈]a, b[ tale che f ′ (ξ) = 0<br />

a Michel Rolle (1652- 1719) fu un matematico<br />

francese. È conosciuto per il teorema che porta il<br />

suo nome. Si deve a lui la notazione della ra<strong>di</strong>ce<br />

n-sima per mezzo del simbolo n√ x.<br />

Teorema 1.5.2 (del Valor Me<strong>di</strong>o) Sia<br />

f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[,<br />

allora esiste un punto ξ ∈]a, b[ tale che<br />

f ′ f(b) − f(a)<br />

(ξ) =<br />

b − a<br />

Teorema 1.5.3 (del Valore Interme<strong>di</strong>o)<br />

Sia f ∈ C([a, b]) e sia K un valore compreso<br />

tra f(a) e f(b). Allora esiste almeno un<br />

punto ξ ∈]a, b[ tale che f(ξ) = K.<br />

Quin<strong>di</strong> per funzioni continue, un valore compreso tra i due estremi dell’insieme <strong>di</strong><br />

definizione, è un valore assunto dalla funzione stessa (in uno o più punti).<br />

Come conseguenza <strong>di</strong> questo teorema, se f(a)f(b) < 0 (la funzione assume segno opposto<br />

agli estremi dell’intervallo [a, b]) allora esiste almeno un punto ξ tale che f(ξ) = 0, cioè esiste<br />

almeno una ra<strong>di</strong>ce dell’equazione f(x) = 0 nell’intervallo [a, b].<br />

Teorema 1.5.4 (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e<br />

tale che a ≤ g(x) ≤ b per ogni x ∈ [a, b], allora g ammette almeno un punto fisso.<br />

Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol <strong>di</strong>re che<br />

esiste almeno un punto ξ nel suo insieme <strong>di</strong> definizione, tale che g(ξ) = ξ.<br />

Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell’intervallo [a, b] e, in<br />

particolare a ≤ g(a) ≤ b e a ≤ g(b) ≤ b. Definiamo, perciò, la funzione continua Φ(x) me<strong>di</strong>ante<br />

la relazione<br />

Φ(x) = g(x) − x<br />

Allora Φ(a) = g(a) − a > 0 e Φ(b) = g(b) − b < 0. Per il Teorema del Valore Interme<strong>di</strong>o esiste<br />

almeno un punto ξ ∈]a, b[ tale che Φ(ξ) = 0, vale a <strong>di</strong>re g(ξ) − ξ = 0, cioè g(ξ) = ξ. Esiste<br />

almeno un punto fisso per la funzione g. ✔<br />

4


1.5. Altri teoremi<br />

Teorema 1.5.5 (Esistenza e unicità del punto fisso) Data una funzione g <strong>di</strong> classe C 1 in<br />

[a, b], con a ≤ g(x) ≤ b per ogni x ∈ [a, b], e con |g ′ (x)| ≤ m < 1 per ogni x ∈ [a, b] allora esiste ed è<br />

unico il punto fisso della g in tale intervallo.<br />

Dimostrazione. L’esistenza <strong>di</strong> almeno un punto fisso è assicurata dal teorema precedente<br />

(le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due<br />

punti fissi ξ e η, con ξ ≠ η, per la funzione g. Si ha<br />

|ξ − η| = |g(ξ) − g(η)|<br />

Applicando il teorema del Valor Me<strong>di</strong>o, esiste un punto c compreso tra ξ e η per cui<br />

|g(ξ) − g(η)| = |g ′ (c)(ξ − η)| ≤ |g ′ (c)||ξ − η|<br />

Ma per ipotesi |g ′ (c)| ≤ m < 1 da cui<br />

|ξ − η| ≤ m|ξ − η| < |ξ − η|<br />

Si arriva ad una contrad<strong>di</strong>zione. L’assurdo deriva dall’aver supposto ξ ≠ η. Quin<strong>di</strong> ξ = η e il<br />

punto fisso è unico. ✔<br />

Teorema 1.5.6 (del Valor Me<strong>di</strong>o del Calcolo Integrale) Se f ∈ C([a, b]) e g è integrabile in<br />

[a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ∈]a, b[ tale che<br />

∫ b<br />

a<br />

f(x)g(x) d x = f(ξ)<br />

∫ b<br />

a<br />

g(x) d x<br />

Per g ≡ 1, questo teorema ci dà il valore me<strong>di</strong>o della funzione f sull’intervallo [a, b], dato<br />

da f(ξ) = 1 ∫ b<br />

b − a<br />

a f(x) d x<br />

Teorema 1.5.7 (<strong>di</strong> Rolle generalizzato) Sia f ∈ C([a, b]) n volte <strong>di</strong>fferenziabile in ]a, b[. Se f<br />

si annulla in n + 1 punti <strong>di</strong>stinti x 0 , x 1 , . . . , x n in ]a, b[, allora esiste un punto ξ ∈]a, b[ in cui la<br />

derivata n-sima della f si annulla: f (n) (ξ) = 0.<br />

Teorema 1.5.8 (Formula <strong>di</strong> Taylor) 1<br />

Sia f ∈ C 2 ([a, b]) e sia x 0 un punto dell’intervallo [a, b]. Allora, per qualunque x ∈ [a, b] si può<br />

scrivere:<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />

f ′′ (ξ x )<br />

2<br />

dove ξ x è un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />

La formula appena scritta si <strong>di</strong>ce formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 nel punto x.<br />

La formula <strong>di</strong> Taylor appena scritta si può generalizzare se la funzione f è derivabile n + 1<br />

volte. Si ha così la formula polinomiale <strong>di</strong> Taylor <strong>di</strong> centro x 0 :<br />

dove<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />

2!<br />

R n (x) = f (n+1) (ξ x )<br />

(x − x 0 ) n+1<br />

(n + 1)!<br />

(x − x 0 ) 2 + . . . + f (n) (x 0 )<br />

(x − x 0 ) n + R n<br />

n!<br />

con ξ x un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />

1 Brook Taylor (1685 - 1731) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle<br />

<strong>di</strong>fferenze finite. L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne<br />

riconosciuta solo nel 1772 da Lagrange.<br />

5


CAPITOLO 2<br />

Funzioni reali <strong>di</strong> più variabili<br />

La facoltà che mette in moto<br />

l’invenzione matematica non è<br />

il ragionamento, bensì<br />

l’immaginazione.<br />

Augustus De Morgan<br />

(1806-1871)<br />

2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . . 9<br />

2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . . 13<br />

2.1 Lo spazio R n<br />

Dallo stu<strong>di</strong>o <strong>di</strong> funzioni reali <strong>di</strong> variabili reali f : R −→ R che alla variabile x ∈ R associa<br />

il valore f(x) ∈ R, passiamo a stu<strong>di</strong>are funzioni reali <strong>di</strong> più variabili: non c’è più una sola<br />

variabile x come variabile <strong>di</strong> input della nostra funzione, ma possiamo avere due o più<br />

variabili <strong>di</strong> input mentre il valore che assume la funzione rimane un valore reale (detto<br />

anche scalare).<br />

Se (x, y) è la coppia <strong>di</strong> variabili, ciascuna delle quali varia in R, possiamo definire una<br />

funzione f che alla coppia (x, y) associa il valore f(x, y).<br />

Analogamente, data la terna <strong>di</strong> variabili reali (x, y, z), si può definire una funzione f che,<br />

in corrispondenza <strong>di</strong> (x, y, z), assume il valore reale f(x, y, z),<br />

Il <strong>di</strong>scorso si può generalizzare con una n−nupla <strong>di</strong> valori (x 1 , x 2 , . . . , x n ) introducendo<br />

una funzione f che, per ogni n−nupla (x 1 , x 2 , . . . , x n ) associa il valore reale f(x 1 , x 2 , . . . , x n ).<br />

Introduciamo, dunque, lo spazio R n , dove n è un intero naturale, per definire lo spazio a<br />

n <strong>di</strong>mensioni.<br />

Un punto P ∈ R n è definito da una n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali (x 1 , x 2 , . . . , x n ).<br />

Ciascun valore x i , i = 1, 2, . . . , n, prende il nome <strong>di</strong> coor<strong>di</strong>nata i−sima del punto P . Data<br />

una funzione f definita in R n , possiamo scrivere f(x 1 , x 2 , . . . , x n ) o f(P ) per <strong>di</strong>re che stiamo<br />

valutando la funzione nel punto P .<br />

G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome<br />

<strong>di</strong> scalari.<br />

G Per n = 2 si ha lo spazio R 2 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y) (x<br />

prende il nome <strong>di</strong> ascissa del punto, mentre y è l’or<strong>di</strong>nata del punto).<br />

7


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

Figura 2.1: Grafici delle tre funzioni f 1 , f 2 e f 3 .<br />

G Per n = 3 si ha lo spazio R 3 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y, z),<br />

rispettivamente ascissa, or<strong>di</strong>nata e quota del punto.<br />

Esempi <strong>di</strong> funzioni <strong>di</strong> più variabili in R 2 sono:<br />

G f 1 (x, y) = x + y<br />

G f 2 (x, y) = |x| + |y|<br />

G f 3 (x, y) = (x + y) cos (x + y)<br />

Di queste funzioni è possibile fare il grafico: così come una funzione reale <strong>di</strong> una variabile<br />

reale genera una curva nello spazio R 2 una funzione reale <strong>di</strong> due variabili reali genera una<br />

superficie nello spazio R 3 .<br />

Per il grafico <strong>di</strong> funzioni reali <strong>di</strong> tre o più variabili reali il <strong>di</strong>scorso si complica perchè<br />

va fatto in uno spazio che ha una <strong>di</strong>mensione in più rispetto a quello <strong>di</strong> partenza (che non<br />

riusciamo quin<strong>di</strong> a visualizzare). In tal caso il grafico genera un’ipersuperficie. Esempi <strong>di</strong><br />

funzioni reali in R 3 sono:<br />

G f 1 (x, y, z) = x 3 + xyz + y 2 + z<br />

G f 2 (x, y, z) = sin (xyz)<br />

G f 3 (x, y, z) = e x+y+z<br />

2.2 Definizioni preliminari<br />

Come per le funzioni <strong>di</strong> una sola variabile reale (funzioni scalari) sono stati definiti e<br />

analizzati i concetti <strong>di</strong> continuità, <strong>di</strong>fferenziabilità, limite, integrale e derivata, anche per le<br />

funzioni <strong>di</strong> più variabili possono essere fatti gli analoghi stu<strong>di</strong>.<br />

A tale scopo, dobbiamo introdurre alcune definizioni (che valgono in generale per uno<br />

spazio R n ma che noi vedremo poi in particolare per gli spazi R 2 e R 3 )<br />

Definizione 2.2.1 Si definisce funzione <strong>di</strong> n variabili reali una legge che assegna un unico<br />

numero reale f(x 1 , x 2 , . . . , x n ) ∈ R a ciascun punto (x 1 , x 2 , . . . , x n ) contenuto in un sottoinsieme<br />

D(f) <strong>di</strong> R n . L’insieme dei punti D(f) prende il nome <strong>di</strong> insieme <strong>di</strong> definizione o dominio della<br />

funzione f. L’insieme <strong>di</strong> tutti i numeri reali f(x 1 , x 2 , . . . , x n ) al variare dei punti nel dominio<br />

prende il nome <strong>di</strong> insieme dei valori o codominio della f (o range, per usare il termine matematico<br />

inglese) e si denota con R(f) oppure con f(A) se il dominio della funzione è stato in<strong>di</strong>cato<br />

con l’insieme A.<br />

Per in<strong>di</strong>care una funzione f si possono usare le seguenti scritture:<br />

f : D(f) −→ R(f) dove D(f) ⊂ R n , R(f) ⊂ R<br />

f : A −→ B dove A ⊂ R n , B ⊂ R, f(A) ⊂ B<br />

Per funzioni <strong>di</strong> una variabile reale, è usuale in<strong>di</strong>care la funzione con la notazione y = f(x),<br />

dal momento che il valore della funzione viene rappresentato sull’asse delle y nel piano<br />

8


2.2. Definizioni preliminari<br />

Figura 2.2: Rappresentazione grafica <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali f(x, y).<br />

cartesiano xy. Alla stessa maniera, è usuale in<strong>di</strong>care funzioni reali <strong>di</strong> due variabili reali<br />

me<strong>di</strong>ante la notazione z = f(x, y), visto che il valore <strong>di</strong> questa funzione viene rappresentato<br />

sull’asse delle z. Per quanto riguarda il grafico <strong>di</strong> una funzione f in R 2 , si può dare la<br />

seguente definizione:<br />

Definizione 2.2.2 Data una funzione f : D(f) −→ R(f) in R 2 , il grafico ad essa associato è<br />

dato dall’insieme<br />

{<br />

}<br />

G(f) = (x, y, z) ∈ R 3 : (x, y) ∈ D(f), z = f(x, y)<br />

In Figura 2.2 è rappresentato il grafico <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali, nello<br />

spazio R 2 . I valori della funzione sono rappresentati sull’asse delle z, dove in rosso è rappresentato<br />

l’insieme dei valori della funzione R(f), mentre sul piano xy, in blu, è rappresentato<br />

l’insieme <strong>di</strong> definizione D(f). Generalmente, il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili può<br />

essere o l’intero spazio R 2 o un suo sottoinsieme (come nella Figura 2.2).<br />

A volte, il dominio <strong>di</strong> una funzione non è specificato. Come capire qual è l’insieme dei<br />

punti per i quali la funzione f esiste Ci soffermiamo sul caso <strong>di</strong> una funzione definita in<br />

R 2 .<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili<br />

Come regola generale, se è data una funzione f(x, y) ma non vi è nessuna informazione sul<br />

dominio, allora il dominio sarà dato da tutti i punti del piano xy ad eccezione (o escludendo)<br />

quei punti (se ce ne sono) nei quali la funzione non può essere definita. Sono due le situazioni<br />

in cui una funzione f non può essere definita in un punto (x 0 , y 0 ): se il valore f(x 0 , y 0 ) non è<br />

un numero reale o se la funzione in (x 0 , y 0 ) assumerebbe valori ±∞.<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi.<br />

9


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

(<br />

Figura 2.3: Grafico della funzione z = f(x, y) = 5 1 − x 4 − y )<br />

.<br />

8<br />

Esempio<br />

Es. 2.2.1 Sia data la funzione z = f(x, y) = x 3 + x 2 y. Questa funzione è ben definita per<br />

tutti i valori <strong>di</strong> x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre<br />

valori reali. Quin<strong>di</strong> f è definita in tutto R 2 .<br />

Esempio<br />

(<br />

Es. 2.2.2 Sia ora z = f(x, y) = 5 1 − x 4 − y )<br />

per 0 ≤ x ≤ 2 e per 0 ≤ y ≤ 8 − 4x.<br />

8<br />

In tal caso la funzione è assegnata su uno specifico dominio, quin<strong>di</strong>, anche se la funzione<br />

è ben definita per tutti i valori <strong>di</strong> x e <strong>di</strong> y, il dominio in cui va stu<strong>di</strong>ata, in questo esempio,<br />

è quello dato, vale a <strong>di</strong>re per x ∈ [0, 2], e per y che varia nell’intervallo [0, 8] quando x = 0,<br />

mentre y = 0 quando x = 2. Ciò significa che l’insieme <strong>di</strong> definizione è dato dal triangolo<br />

<strong>di</strong> estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3).<br />

Esempio<br />

Es. 2.2.3 Ve<strong>di</strong>amo ora la funzione z = f(x, y) = √ 16 − x 2 − y 2 .<br />

Questa funzione è ben definita solo quando l’espressione sotto ra<strong>di</strong>ce è non negativa.<br />

Perciò il suo dominio è dato dai punti (x,y) che sod<strong>di</strong>sfano la con<strong>di</strong>zione<br />

16 − x 2 − y 2 ≥ 0 ⇐⇒ x 2 + y 2 ≤ 16<br />

Questa con<strong>di</strong>zione definisce il dominio: si tratta del cerchio <strong>di</strong> centro l’origine e raggio 4<br />

nel piano xy. Infatti √ x 2 + y 2 è la definizione <strong>di</strong> <strong>di</strong>stanza <strong>di</strong> un punto (x, y) dall’origine<br />

del piano, da cui la con<strong>di</strong>zione x 2 + y 2 ≤ 16 è equivalente a √ x 2 + y 2 ≤ 4 ovvero l’insieme<br />

dei punti la cui <strong>di</strong>stanza dall’origine è minore o uguale a 4, vale a <strong>di</strong>re il cerchio <strong>di</strong> centro<br />

l’origine e raggio 4. Il grafico <strong>di</strong> questa funzione è una semisfera nel semipiano per z ≥ 0.<br />

10


2.2. Definizioni preliminari<br />

Esempio<br />

Es. 2.2.4 Sia z = f(x, y) = 10 . In tal caso, il dominio non è specificato ma ci accorgiamo<br />

subito che la funzione, per essere definita, deve avere il denominatore <strong>di</strong>verso da<br />

x − y<br />

zero. Quin<strong>di</strong> la funzione non è definita per x = y. Il dominio della f è dunque tutto il<br />

piano xy privato della retta x = y.<br />

Per poter andare avanti nello stu<strong>di</strong>o delle funzioni, dobbiamo riprendere o generalizzare<br />

altri concetti <strong>di</strong> base. Incominciamo dai vettori.<br />

2.2.2 Sui vettori<br />

Un punto P ∈ R n può essere visto anche come vettore <strong>di</strong> R n . Abbiamo infatti la seguente<br />

definizione<br />

Definizione 2.2.3 Un vettore <strong>di</strong> R n è un’n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali.<br />

Un vettore lo si in<strong>di</strong>ca me<strong>di</strong>ante il simbolo ⃗x. Quin<strong>di</strong> ⃗x è definito me<strong>di</strong>ante (x 1 , x 2 , . . . , x n ).<br />

Una funzione che generalizza ai vettori il valore assoluto <strong>di</strong> un numero reale prende il<br />

nome <strong>di</strong> norma. Esistono <strong>di</strong>versi tipi <strong>di</strong> norme. Noi consideriamo la norma euclidea e la<br />

chiameremo brevemente norma o modulo. Abbiamo la seguente definizione.<br />

Definizione 2.2.4 Dato un vettore ⃗x ∈ R n , si definisce modulo (o norma euclidea <strong>di</strong> ⃗x) la<br />

quantità scalare data da<br />

∑<br />

|⃗x| = √ n (x i ) 2<br />

i=1<br />

(con il simbolo ∑ n<br />

i=1 (x i) 2 in<strong>di</strong>chiamo la somma (x 1 ) 2 + (x 2 ) 2 + . . . (x n ) 2 ).<br />

Definizione 2.2.5 Dati due vettori ⃗x e ⃗y in R n si definisce <strong>di</strong>stanza tra i due vettori la quantità<br />

|⃗x − ⃗y|.<br />

Geometricamente, la <strong>di</strong>stanza tra due vettori non è altro che la <strong>di</strong>stanza euclidea tra due<br />

punti.<br />

Esempio<br />

Es. 2.2.5 Siano dati i due vettori ⃗p = (7, 1) e ⃗q = (3, 4). La <strong>di</strong>stanza tra i due vettori è<br />

data da<br />

|⃗p − ⃗q| = √ (7 − 3) 2 + (1 − 4) 2 = √ 16 + 9 = √ 25 = 5<br />

Se ve<strong>di</strong>amo i due vettori come i punti del piano P e Q che hanno coor<strong>di</strong>nate rispettivamente<br />

(7, 1) e (3, 4) e vogliamo calcolare la <strong>di</strong>stanza tra i due punti, dobbiamo applicare<br />

esattamente la stessa formula (si veda Figura 2.4).<br />

Quin<strong>di</strong> due punti nello spazio R n possono essere visti come vettori e viceversa. Di conseguenza,<br />

in R 2 o R 3 , quella che per noi è la <strong>di</strong>stanza tra due punti P e Q, e che ricaviamo<br />

applicando il teorema <strong>di</strong> Pitagora, può essere vista come la <strong>di</strong>stanza tra i due vettori.<br />

Presi due punti P e Q in R n possiamo fare P + Q o P − Q considerandoli come vettori e<br />

quin<strong>di</strong> sommando o facendo la <strong>di</strong>fferenza delle componenti omonime dei punti-vettori. Tutte<br />

le operazioni che possiamo fare tra vettori si ripetono tra punti.<br />

11


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

Figura 2.4: Distanza tra due vettori ⃗p e ⃗q o <strong>di</strong>stanza tra due punti P e Q.<br />

Figura 2.5: A sinistra: somma e <strong>di</strong>fferenza tra punti in R 2 . A destra: prodotto <strong>di</strong> uno scalare<br />

per un punto. I vettori αQ, βQ, γQ e δQ sono messi sfalsati per ragioni pratiche <strong>di</strong> visibilità<br />

ma sono sulla stessa linea.<br />

Esempio<br />

Es. 2.2.6 Siano dati i due punti <strong>di</strong> R n , P (p 1 , p 2 , . . . , p n ) e Q(q 1 , q 2 , . . . , q n ) (usiamo questa<br />

notazione per rappresentare il punto P (o Q) <strong>di</strong> coor<strong>di</strong>nate (p 1 , p 2 , . . . , p n ) (o (q 1 , q 2 , . . . , q n )).<br />

Allora il punto P + Q ha componenti (p 1 + q 1 , p 2 + q 2 , . . . , p n + q n ), mentre il punto P − Q è<br />

dato da (p 1 − q 1 , p 2 − q 2 , . . . , p n − q n ).<br />

Dato uno scalare α, il punto αP è dato da (αp 1 , αp 2 , . . . , αp n ).<br />

Si veda Figura 2.5 per vedere l’interpretazione geometrica lavorando tra vettori.<br />

Definizione 2.2.6 Dati due vettori ⃗x e ⃗y, si definisce prodotto scalare tra i due vettori il numero<br />

reale in<strong>di</strong>cato con il simbolo ⃗x · ⃗y dato da<br />

12<br />

⃗x · ⃗y =<br />

n∑<br />

x i y i<br />

i=1


2.2. Definizioni preliminari<br />

Figura 2.6: Intervallo aperto ]a 1 , a 2 ]×]b 1 , b 2 [<br />

Figura 2.7: Esempio <strong>di</strong> insieme limitato in R 2 .<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera...<br />

Definizione 2.2.7 Dati due punti <strong>di</strong> R n , A (a 1 , a 2 , . . . , a n ) e B (b 1 , b 2 , . . . , b n ), con a i < b i (per<br />

i = 1, 2, . . . , n), si definisce intervallo aperto <strong>di</strong> R n <strong>di</strong> vertici A e B l’insieme dato da<br />

T = {P ∈ R n <strong>di</strong> coor<strong>di</strong>nate (x 1 , x 2 , . . . , x n ) t. c. a i < x i < b i , i = 1, 2, . . . , n}<br />

In R 2 un intervallo aperto <strong>di</strong> vertici A e B è dato dal rettangolo i cui punti (x, y) sono<br />

presi, rispettivamente, negli intervalli aperti ]a 1 , a 2 [ e ]b 1 , b 2 [, che possiamo in<strong>di</strong>care come<br />

]a 1 , a 2 ]×]b 1 , b 2 [ (si veda Figura 2.6)<br />

Definizione 2.2.8 I ⊂ R n si definisce insieme limitato <strong>di</strong> R n se esiste un intervallo aperto che<br />

lo contiene.<br />

Passiamo ora a considerare l’intorno <strong>di</strong> un punto. In R sappiamo che vale la seguente<br />

definizione.<br />

Definizione 2.2.9 Dato x 0 ∈ R e ɛ > 0, l’insieme dei punti x sull’asse reale che hanno <strong>di</strong>stanza<br />

da x 0 minore <strong>di</strong> ɛ è un intervallo aperto <strong>di</strong> centro x 0 e raggio ɛ che prende il nome <strong>di</strong> intorno <strong>di</strong><br />

13


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

x 0 . Se in<strong>di</strong>chiamo con A ɛ (x 0 ) questo insieme, possiamo <strong>di</strong>re che<br />

A ɛ (x 0 ) = {x ∈ R : |x − x 0 | < ɛ}<br />

Generalizziamo questa definizione in R n .<br />

Definizione 2.2.10 Dato P 0 ∈ R n e ɛ > 0, l’insieme dei punti P <strong>di</strong> R n che hanno <strong>di</strong>stanza da<br />

P 0 minore <strong>di</strong> ɛ prende il nome <strong>di</strong> intorno circolare <strong>di</strong> centro P 0 e raggio ɛ.<br />

In<strong>di</strong>chiamo con A ɛ (P 0 ) questo insieme, possiamo <strong>di</strong>re che<br />

A ɛ (P 0 ) = {P ∈ R n : |P − P 0 | < ɛ}<br />

G In R 2 , considerando P 0 (x 0 , y 0 ), e il generico punto P (x, y) si ha<br />

{<br />

A ɛ (P 0 ) = P (x, y) ∈ R 2 : √ }<br />

(x − x 0 ) 2 + (y − y 0 ) 2 < ɛ<br />

Osserviamo che l’equazione<br />

(x − x 0 ) 2 + (y − y 0 ) 2 = ɛ 2<br />

rappresenta l’equazione <strong>di</strong> una circonferenza <strong>di</strong> centro il punto (x 0 , y 0 ) e raggio ɛ. Quin<strong>di</strong><br />

l’intorno <strong>di</strong> (x 0 , y 0 ) è dato da tutti i punti contenuti all’interno della circonferenza (nel<br />

cerchio), ma non i punti che si trovano sulla circonferenza.<br />

G In R 3 , preso P 0 (x 0 , y 0 , z 0 ) e considerato P (x, y, z) il generico punto <strong>di</strong> R 3 , si ha<br />

{<br />

A ɛ (P 0 ) = P (x, y, z) ∈ R 3 : √ }<br />

(x − x 0 ) 2 + (y − y 0 ) 2 + (z − z 0 ) 2 < ɛ<br />

Dal momento che l’equazione<br />

(x − x 0 ) 2 + (y − y 0 ) 2 + (−z 0 ) 2 = ɛ 2<br />

rappresenta l’equazione della sfera <strong>di</strong> centro P 0 e raggio ɛ, l’intorno <strong>di</strong> P 0 è dato da tutti<br />

i punti che si trovano all’interno della sfera ma non sulla superficie della sfera.<br />

Ve<strong>di</strong>amo ora altre definizioni che saranno utili nel seguito.<br />

Definizione 2.2.11 Dato I ⊂ R n :<br />

G Diremo che un punto P 0 ∈ R n è un punto <strong>di</strong> frontiera <strong>di</strong> I se ogni intorno <strong>di</strong> P 0 contiene<br />

almeno un punto <strong>di</strong> I e un punto che non appartiene a I.<br />

G Diremo che un punto P 0<br />

∈ R n è un punto interno <strong>di</strong> I se esiste un intorno <strong>di</strong> P 0 tutto<br />

contenuto in I.<br />

G Diremo che I è un insieme chiuso se ciascun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />

G Diremo che I è un insieme aperto se nessun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />

G L’insieme interno <strong>di</strong> I è l’insieme dei punti interni <strong>di</strong> I che non sono <strong>di</strong> frontiera <strong>di</strong> I.<br />

G L’insieme <strong>di</strong> frontiera <strong>di</strong> I è l’insieme <strong>di</strong> tutti i punti <strong>di</strong> frontiera <strong>di</strong> I.<br />

G L’insieme esterno <strong>di</strong> I è l’insieme dei punti che non sono <strong>di</strong> I e che non sono <strong>di</strong> frontiera<br />

<strong>di</strong> I.<br />

Definizione 2.2.12 Dato I ⊂ R n :<br />

G Diremo che P 0 ∈ R n è punto <strong>di</strong> accumulazione <strong>di</strong> I se per ogni intorno <strong>di</strong> P 0 ci sono infiniti<br />

punti che appartengono a I.<br />

G Diremo che P 0 ∈ I è punto isolato <strong>di</strong> I se non è punto <strong>di</strong> accumulazione per I.<br />

14<br />

Esempi:<br />

G L’intorno circolare <strong>di</strong> un punto P 0 , A ɛ (P 0 ) è un insieme aperto perchè nessun punto<br />

della frontiera appartiene ad esso.


2.2. Definizioni preliminari<br />

Figura 2.8: Esempio in R 2 <strong>di</strong> punti interni, <strong>di</strong> frontiera, <strong>di</strong> intorno <strong>di</strong> un punto.<br />

G L’insieme che denotiamo con il simbolo C ɛ (P 0 ), dato da<br />

C ɛ (P 0 ) = {P ∈ R n : |P − P 0 | ≤ ɛ}<br />

è un insieme chiuso perchè ciascun punto della frontiera appartiene ad esso.<br />

G Gli insiemi R n e ∅ sono sia insiemi chiusi sia insiemi aperti per convenzione.<br />

Definizione 2.2.13 Dato un insieme I ⊂ R n<br />

dall’unione <strong>di</strong> I e della sua frontiera.<br />

si definisce chiusura <strong>di</strong> I l’insieme formato<br />

Ad esempio, l’insieme C ɛ (P 0 ) rappresenta la chiusura <strong>di</strong> A ɛ (P 0 ).<br />

Definizione 2.2.14 Se I ⊂ R n è chiuso e limitato, esso si <strong>di</strong>ce compatto.<br />

15


CAPITOLO 3<br />

Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni<br />

<strong>di</strong> più variabili<br />

La mente che si apre ad una<br />

nuova idea non torna mai alla<br />

<strong>di</strong>mensione precedente.<br />

Albert Einstein (1879-1955)<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Il concetto <strong>di</strong> limite <strong>di</strong> una funzione <strong>di</strong> più variabili è molto simile a quello per funzioni <strong>di</strong><br />

una sola variabile.<br />

Consideriamo una funzione <strong>di</strong> due variabili, f(x, y). Diciamo che il limite della funzione<br />

f(x, y) è L per (x, y) che tende a (x 0 , y 0 ) e scriviamo<br />

lim f(x, y) = L<br />

(x,y)→(x 0,y 0)<br />

se tutti i punti <strong>di</strong> un qualunque intorno <strong>di</strong> (x 0 , y 0 ) (senza considerare il punto (x 0 , y 0 )) appartengono<br />

al dominio della funzione e se f(x, y) tende a L quando (x, y) tende a (x 0 , y 0 ). Più<br />

vicino è il punto (x, y) a (x 0 , y 0 ), più il valore della funzione tende al valore del limite.<br />

Formalmente, la definizione è la seguente.<br />

Definizione 3.1.1 Siano dati una funzione f : I −→ R, con I ⊂ R 2 , il punto P 0 (x 0 , y 0 ), punto <strong>di</strong><br />

accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />

lim<br />

(x,y)→(x 0,y 0) f(x, y) = L 17


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

se:<br />

G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />

può essere data dal punto P 0 )<br />

G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />

se 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ allora |f(x, y) − L| < ɛ<br />

qualunque sia il punto P (x, y) ∈ I.<br />

Dalla definizione segue che, qualunque sia il valore <strong>di</strong> ɛ piccolo a piacere, è possibile<br />

trovare un intorno A δ (P 0 ) tale che per ogni punto in questo intorno <strong>di</strong>verso da P 0<br />

(0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ), vale la relazione |f(x, y) − L| < ɛ, cioè il valore f(x, y) si<br />

trova in un intorno <strong>di</strong> L <strong>di</strong> raggio ɛ.<br />

La definizione <strong>di</strong> limite per funzioni <strong>di</strong> due variabili si estende facilmente a funzioni <strong>di</strong> più<br />

variabili.<br />

Definizione 3.1.2 Siano dati una funzione f : I −→ R, con I ⊂ R n , il punto P 0 (x 1 , x 2 , . . . , x n ),<br />

punto <strong>di</strong> accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />

lim f(P ) = L<br />

P →P 0<br />

se:<br />

G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />

può essere data dal punto P 0 )<br />

G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora |f(P ) − L| < ɛ<br />

qualunque sia il punto P ∈ I.<br />

Il limite <strong>di</strong> una funzione può valere anche ±∞ e si può anche parlare <strong>di</strong> limite per P che<br />

tende a infinito.<br />

Definizione 3.1.3 Data f : I −→ R, con I ⊂ R n e dato il punto P 0 <strong>di</strong> accumulazione per I si ha<br />

G lim P →P0 f(P ) = +∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora f(P ) > M<br />

G lim P →P0 f(P ) = −∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora f(P ) < −M<br />

G lim P →∞ f(P ) = L se per ogni valore ɛ > 0, esiste M > 0 tale che<br />

se |P | > M allora |f(P ) − L| < ɛ<br />

Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente<br />

ai limiti <strong>di</strong> funzioni <strong>di</strong> più variabili. Ad esempio, date due funzioni f e g, se lim P →P0 f(P ) = L<br />

e lim P →P0 g(P ) = M con L, M ∈ R, si ha<br />

G lim P →P0 f(P ) ± lim P →P0 g(P ) = L ± M<br />

G lim P →P0 f(P )g(P ) = LM<br />

f(P )<br />

G lim P →P0<br />

g(P ) = L (questo si ha se M ≠ 0).<br />

M<br />

Anche per funzioni <strong>di</strong> più variabili vale il teorema del confronto (noto anche come teorema<br />

dei carabinieri in italiano o squeeze theorem in inglese)<br />

18


3.1. Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x 0 , y 0 ).<br />

Teorema 3.1.1 Se f(x, y) ≤ g(x, y) ≤ h(x, y) per (x, y) in un intorno <strong>di</strong> (x 0 , y 0 ) e se vale<br />

lim f(x, y) = lim g(x, y) = L<br />

(x,y)→(x 0,y 0) (x,y)→(x 0,y 0)<br />

allora anche<br />

lim g(x, y) = L.<br />

(x,y)→(x 0,y 0)<br />

Osserviamo adesso alcuni punti importanti:<br />

G Se esiste il limite <strong>di</strong> una funzione per P che tende a un punto P 0 , questo limite è unico.<br />

G Per funzioni <strong>di</strong> una sola variabile f(x), l’esistenza del limite lim x→x0 f(x) implica che la<br />

funzione si avvicina allo stesso numero finito per x che si avvicina a x 0 sia da sinistra<br />

sia da destra.<br />

G Per funzioni <strong>di</strong> due variabili (e il <strong>di</strong>scorso vale in maniera del tutto analogo anche per<br />

funzioni <strong>di</strong> tre e più variabili), il limite lim (x,y)→(x0,y 0) f(x, y) = L esiste solo se f(x, y)<br />

tende allo stesso numero L qualunque sia il percorso che fa (x, y) per avvicinarsi a<br />

(x 0 , y 0 ) nel piano cartesiano. Ciò significa che (x, y) può avvicinarsi a (x 0 , y 0 ) lungo<br />

qualunque curva che possiamo in<strong>di</strong>viduare nel piano xy e il limite deve valere sempre<br />

L (si veda Figura 3.1).<br />

Abbiamo perciò la seguente proposizione<br />

Proposizione 3.1.1 Data f : I −→ R, I ⊂ R 2 , e dato P 0 punto <strong>di</strong> accumulazione per I, se<br />

esiste il limite lim (x,y)→(x0,y 0) f(x, y) e tale limite vale L numero reale, allora lo stesso limite si<br />

deve avere per P che tende a P 0 su qualunque sottoinsieme <strong>di</strong> I che ha P 0 come punto <strong>di</strong><br />

accumulazione.<br />

Al contrario, se esistono anche solo due sottoinsiemi <strong>di</strong> I in cui esiste il limite della f per P<br />

che tende a P 0 , ma il valore del limite nei due sottoinsiemi non è lo stesso, allora non può<br />

esistere il limite della funzione sull’insieme I <strong>di</strong> partenza (proprio in virtù della proposizione<br />

precedente).<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi <strong>di</strong> calcolo del limite <strong>di</strong> funzioni <strong>di</strong> due variabili.<br />

19


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Esempio<br />

Es. 3.1.1 Consideriamo i seguenti limiti:<br />

lim 3x −<br />

(x,y)→(2,2) y2 =<br />

lim<br />

(x,y)→(3,4) xy2 + x 2 y =<br />

In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto <strong>di</strong><br />

limite:<br />

lim 3x −<br />

(x,y)→(2,2) y2 = 6 − 4 = 2<br />

lim<br />

(x,y)→(3,4) xy2 + x 2 y = 48 + 36 = 84<br />

Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come<br />

somma <strong>di</strong> due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La<br />

seconda funzione è data dalla somma <strong>di</strong> due funzioni, ciascuna delle quali può essere<br />

vista come il prodotto <strong>di</strong> una funzione nella sola variabile x e <strong>di</strong> una funzione nella sola<br />

variabile y. Quin<strong>di</strong> calcoliamo il limite <strong>di</strong> queste funzioni, applichiamo la regola sul limite<br />

<strong>di</strong> prodotto <strong>di</strong> funzioni e otteniamo il risultato.<br />

Esempio<br />

3xy<br />

Es. 3.1.2 Consideriamo ora lim (x,y)→(0,0)<br />

x 2 + y 2 .<br />

Questo limite non esiste perchè si trovano facilmente due strade <strong>di</strong>verse per fare tendere<br />

il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori <strong>di</strong>versi del limite.<br />

Pren<strong>di</strong>amo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, <strong>di</strong>verso da<br />

zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite <strong>di</strong>venta<br />

lim<br />

(x,kx)→(0,0)<br />

3xkx<br />

x 2 + (kx) 2 =<br />

lim<br />

(x,kx)→(0,0)<br />

3kx 2<br />

x 2 + k 2 x 2 =<br />

2k<br />

1 + k 2<br />

Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta<br />

a funzione della sola variabile x, <strong>di</strong>pende da k, e quin<strong>di</strong> cambia al cambiare <strong>di</strong> k. Ciò<br />

significa che la funzione non può avere limite per (x, y) → 0.<br />

Osserviamo che la funzione data è un esempio <strong>di</strong> funzione che non è definita nel punto<br />

(0, 0) in quanto f(0, 0) = 0/0 è una forma indeterminata.<br />

Esempio<br />

Es. 3.1.3 Stu<strong>di</strong>amo ora lim (x,y)→(0,0)<br />

8xy 2<br />

x 2 + y 4 .<br />

Anche questa funzione è indeterminata in (0, 0).<br />

Proviamo a calcolare il limite sulle rette y = kx con k ∈ R, k ≠ 0. Otteniamo<br />

lim<br />

(x,kx)→(0,0)<br />

8k 2 x 3<br />

x 2 + k 4 x 4 = lim<br />

x→0<br />

8k 2 x<br />

1 + k 2 x 2 = 0<br />

Questo limite non <strong>di</strong>pende dunque dalla retta, in quanto non <strong>di</strong>pende da k.<br />

20


3.2. Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe<br />

corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto<br />

per avvicinarsi a (0, 0).<br />

Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo<br />

lim<br />

(ky 2 ,y)→(0,0)<br />

8ky 4<br />

k 2 y 4 + y 4 =<br />

8k<br />

k 2 + 1<br />

In questo caso, il limite <strong>di</strong>pende dalla curva x = ky 2 e il valore non è più 0 ma cambia<br />

al cambiare <strong>di</strong> k. Quin<strong>di</strong> il limite non esiste.<br />

Esempio<br />

Es. 3.1.4 Proviamo invece che<br />

lim<br />

(x,y)→(0,0)<br />

4x 2 y<br />

x 2 + y 2 = 0<br />

In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè<br />

dovremmo <strong>di</strong>mostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è<br />

sempre quello e, quin<strong>di</strong>, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo<br />

applicare la definizione <strong>di</strong> limite.<br />

Ora, poichè x 2 ≤ x 2 +y 2 x 2<br />

si ha<br />

x 2 + y 2 ≤ 1, mentre da y2 ≤ x 2 +y 2 , ricaviamo |y| ≤ √ x 2 + y 2 .<br />

Possiamo dunque <strong>di</strong>re che<br />

4x 2 y<br />

|<br />

x 2 + y 2 − 0| = | 4x 2 y<br />

x 2 + y 2 | ≤ |4y| ≤ 4√ x 2 + y 2<br />

Dalla definizione <strong>di</strong> limite, preso ɛ > 0, dobbiamo provare che esiste δ > 0 tale che per<br />

0 < √ x 2 + y 2 4x 2 y<br />

< δ, risulta |<br />

x 2 − 0| < ɛ.<br />

+ y2 Se scegliamo δ = ɛ/4, abbiamo:<br />

4x 2 y<br />

|<br />

x 2 + y 2 − 0| ≤ 4√ x 2 + y 2 < 4 ɛ 4 = ɛ<br />

4x 2 y<br />

Quin<strong>di</strong> abbiamo provato che |<br />

x 2 − 0| < ɛ, cioè il limite della nostra funzione per<br />

+ y2 (x, y) → (0, 0) vale esattamente 0.<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Definizione 3.2.1 Una funzione f : I −→ R, con I ⊂ R n è continua in P 0 (P 0 ∈ I e punto <strong>di</strong><br />

accumulazione per I), se<br />

lim f(P ) = f(P 0 )<br />

P →P 0<br />

Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, si ha:<br />

Definizione 3.2.2 Una funzione f : I −→ R, con I ⊂ R 2 è continua in P 0 (x 0 , y 0 ) (P 0 ∈ I e punto<br />

<strong>di</strong> accumulazione per I), se<br />

lim f(x, y) = f(x 0, y 0 )<br />

(x,y)→(x 0,y 0)<br />

21


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Definizione 3.2.3 Una funzione si <strong>di</strong>ce continua se è continua in ogni punto del suo insieme<br />

<strong>di</strong> definizione.<br />

Proposizione 3.2.1 Date due funzioni f e g continue in I ⊂ R 2 , allora<br />

f + g è continua;<br />

G fg è continua;<br />

G f è continua in tutti quei punti in g non si annulla;<br />

g<br />

G f ◦ g è continua (f ◦ g(x, y) = f(g(x, y)) funzione composta)<br />

Esempio<br />

Es. 3.2.1 lim (x,y)→(x0,y 0) x sin (xy) = x 0 sin (x 0 y 0 )<br />

La funzione f(x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il<br />

prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la ve<strong>di</strong>amo come la<br />

funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè<br />

x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione<br />

composta <strong>di</strong> funzioni continue è continua (quin<strong>di</strong> sin (xy) è continua) e il prodotto <strong>di</strong> x per<br />

sin (xy) dà ancora una funzione continua.<br />

Osserviamo che il concetto <strong>di</strong> continuità non è ovvio! Ci sono funzioni che ammettono<br />

limite per (x, y) che tende a (x 0 , y 0 ) ma il valore del limite non necessariamente è uguale al<br />

valore della funzione in (x 0 , y 0 ).<br />

Esempio<br />

Es. 3.2.2 La funzione definita come<br />

{<br />

0 se (x, y) ≠ (0, 0)<br />

f(x, y) =<br />

1 se (x, y) = (0, 0)<br />

ammette limite per (x, y) → (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa<br />

funzione non è continua in (0, 0). Difatti lim (x,y)→(0,0) f(x, y) = 0 ≠ f(0, 0) dal momento che<br />

la funzione è <strong>di</strong> costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa<br />

funzione è <strong>di</strong>scontinua in (0, 0).<br />

3.3 Derivate parziali<br />

Esten<strong>di</strong>amo ora il concetto <strong>di</strong> derivata che abbiamo visto per funzioni <strong>di</strong> una sola<br />

variabile, introducendo le derivate parziali.<br />

Data una funzione <strong>di</strong> una sola variabile, f(x), la derivata prima f ′ (x) rappresenta la<br />

velocità <strong>di</strong> variazione della funzione al variare <strong>di</strong> x.<br />

Con le funzioni <strong>di</strong> più variabili, ci sono due casi da considerare: cosa fare se varia solo<br />

una variabile mentre le altre non variano cosa fare se varia più <strong>di</strong> una variabile<br />

Concentriamo ora la nostra attenzione facendo cambiare una variabile alla volta e<br />

lasciando le altre fisse.<br />

Partiamo con un esempio, lavorando con una funzione <strong>di</strong> due variabili.<br />

Esempio<br />

Es. 3.3.1 Sia data f(x, y) = 4x 3 y 5 . Determiniamo la velocità con cui la funzione cambia<br />

in un punto fissato (x 0 , y 0 ), se non facciamo variare la y mentre facciamo variare la x,<br />

e viceversa, determiniamo la velocità con cui cambia la funzione in (x 0 , y 0 ) fissando x e<br />

variando y.<br />

22


3.3. Derivate parziali<br />

Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo interessati<br />

alla velocità della funzione nel punto (x 0 , y 0 ), per y fissato, vuol <strong>di</strong>re che dobbiamo<br />

considerare la funzione per y = y 0 . Consideriamo quin<strong>di</strong> f(x, y 0 ) = 4x 3 (y 0 ) 5 . Adesso<br />

abbiamo una funzione <strong>di</strong> una sola variabile, la x. Possiamo quin<strong>di</strong> considerare la funzione<br />

g(x) = f(x, y 0 ) = 4x 3 (y 0 ) 5 . Di questa funzione in una sola variabile, sappiamo<br />

cosa dobbiamo fare se vogliamo determinare la velocità <strong>di</strong> cambiamento della funzione<br />

per x = x 0 : dobbiamo calcolare la derivata prima g ′ (x 0 ). Nell’esempio, abbiamo<br />

g ′ (x 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />

Quello che abbiamo ottenuto prende il nome <strong>di</strong> derivata parziale <strong>di</strong> f(x, y) rispetto a x,<br />

nel punto (x 0 , y 0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli:<br />

f x (x 0 , y 0 )<br />

∂f<br />

∂x (x 0, y 0 ) D x f(x 0 , y 0 )<br />

Al posto <strong>di</strong> (x 0 , y 0 ) si può scrivere anche P 0 intendendo per P 0 il punto <strong>di</strong> coor<strong>di</strong>nate<br />

(x 0 , y 0 ).<br />

Quin<strong>di</strong>, nel nostro esempio, f x (x 0 , y 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />

Ve<strong>di</strong>amo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso,<br />

dobbiamo considerare la funzione h(y) = f(x 0 , y) = 4(x 0 ) 3 y 5 e calcolare la derivata prima<br />

<strong>di</strong> questa funzione che <strong>di</strong>pende dalla sola variabile y nel punto y 0 . Abbiamo h ′ (y 0 ) =<br />

20(x 0 ) 3 (y 0 ) 4 .<br />

Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel<br />

punto (x 0 , y 0 ). In<strong>di</strong>chiamo questa derivata parziale con uno dei seguenti simboli:<br />

f y (x 0 , y 0 )<br />

∂f<br />

∂y (x 0, y 0 ) D y f(x 0 , y 0 )<br />

Quin<strong>di</strong>, per l’esempio considerato, f y (x 0 , y 0 ) = 20(x 0 ) 3 (y 0 ) 4 .<br />

Passiamo dunque alla definizione generale delle derivate parziali prime <strong>di</strong> una funzione<br />

<strong>di</strong> due variabili (considerando le derivate non più in (x 0 , y 0 ) ma nel generico punto (x, y)).<br />

Definizione 3.3.1 Data una funzione f(x, y), le derivate parziali prime rispetto alle variabili x<br />

e y sono date da:<br />

f(x + h, y) − f(x, y)<br />

(x, y) = lim<br />

h→0 h<br />

∂f<br />

∂x<br />

∂f<br />

(x, y) = lim<br />

∂y h→0<br />

f(x, y + h) − f(x, y)<br />

h<br />

Derivate per funzioni scalari e derivate per funzioni <strong>di</strong> due variabili<br />

f(x) =⇒ f ′ (x) = df<br />

dx<br />

f(x, y) =⇒ f x (x, y) = ∂f<br />

∂x<br />

&<br />

f y (x, y) = ∂f<br />

∂y<br />

Per calcolare le derivate parziali prime <strong>di</strong> una funzione bisogna fare questo ragionamento:<br />

se dobbiamo calcolare f x (x, y) dobbiamo trattare la variabile y come una costante e trattare la<br />

funzione come se <strong>di</strong>pendesse dalla sola x; se dobbiamo calcolare f y (x, y), dobbiamo trattare<br />

x come una costante e calcolare la derivata rispetto a y come se la funzione fosse <strong>di</strong>pendente<br />

dalla sola variabile y.<br />

23


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Esempio<br />

Es. 3.3.2 Calcolare le derivate parziali prime della funzione f(x, y) = 3x 5 + 2 √ y − 10xy.<br />

Per calcolare la derivata f x (x, y) trattiamo la y come una costante, da cui f x (x, y) = 15x 4 −<br />

10y. Notiamo che la derivata rispetto a x <strong>di</strong> 2 √ y vale zero perchè la y è una costante.<br />

Al contrario, per calcolare f y (x, y) dobbiamo ora trattare x come una costante, da cui<br />

f y (x, y) = 1 √ y<br />

− 10x.<br />

3.4 Interpretazione delle derivate parziali<br />

Sono possibili due interpretazioni sul significato delle derivate parziali prime.<br />

G Se consideriamo la derivata parziale come la velocità <strong>di</strong> cambiamento della funzione<br />

allora f x (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al variare <strong>di</strong> x<br />

per y fissato, mentre f y (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al<br />

variare <strong>di</strong> y per x fissato. Quin<strong>di</strong> se f x (x 0 , y 0 ) > 0 vuol <strong>di</strong>re che la funzione è crescente<br />

in quel punto al variare <strong>di</strong> x, per y 0 fissato, mentre se f x (x 0 , y 0 ) < 0 vuol <strong>di</strong>re che la<br />

funzione è decrescente in quel punto al variare <strong>di</strong> x, per y 0 fissato. Stesso <strong>di</strong>scorso vale<br />

su f y (x 0 , y 0 ): se f y (x 0 , y 0 ) > 0 allora la funzione è crescente in quel punto al variare <strong>di</strong> y,<br />

per x 0 fissato, mentre se f y (x 0 , y 0 ) < 0 la funzione è decrescente in quel punto al variare<br />

<strong>di</strong> y, per x 0 fissato. È possibile che una funzione sia crescente fissato y e decrescente<br />

fissato x o viceversa.<br />

G L’altra interpretazione, geometrica, estende il concetto <strong>di</strong> pendenza della retta tangente<br />

che abbiamo per funzioni <strong>di</strong> una sola variabile, per cui f ′ (x 0 ) rappresenta la pendenza<br />

della retta tangente alla funzione f(x) nel punto x 0 . Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili,<br />

f x (x 0 , y 0 ) rappresenta la pendenza della traccia della funzione f(x, y) nel piano y = y 0 nel<br />

punto (x 0 , y 0 ) (in altre parole è la pendenza della retta tangente alla curva che si ottiene<br />

intersecando la superficie che rappresenta la funzione f(x, y), cioè il grafico della f, con<br />

il piano verticale y = y 0 ), mentre f y (x 0 , y 0 ) rappresenta la pendenza della traccia della<br />

funzione f(x, y) con il piano x = x 0 nel punto (x 0 , y 0 ).<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato<br />

Così come per le funzioni <strong>di</strong> una sola variabile è possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne<br />

più elevato (derivata seconda, terza, quarta, n-sima), anche per le funzioni <strong>di</strong> più variabili è<br />

possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne più elevato. Ci soffermiamo al caso <strong>di</strong> funzioni <strong>di</strong> due<br />

variabili.<br />

Data una funzione f(x, y), dal momento che abbiamo due derivate parziali prime f x e<br />

f y , su ciascuna <strong>di</strong> queste funzioni possiamo pensare <strong>di</strong> applicare ancora la definizione<br />

<strong>di</strong> derivata parziale rispetto a x e rispetto a y, ottenendo, in tal modo, quattro possibili<br />

combinazioni.<br />

Abbiamo le seguenti scritture:<br />

(f x ) x = f xx = ∂ ( ) ∂f<br />

∂x ∂x<br />

(f x ) y = f xy = ∂ ( ) ∂f<br />

∂y ∂x<br />

= ∂2 f<br />

∂x 2<br />

= ∂2 f<br />

∂y∂x<br />

24


3.6. Differenziabilità <strong>di</strong> una funzione<br />

(f y ) x = f yx = ∂ ( ) ∂f<br />

∂x ∂y<br />

(f y ) y = f yy = ∂ ( ) ∂f<br />

∂y ∂y<br />

= ∂2 f<br />

∂x∂y<br />

= ∂2 f<br />

∂y 2<br />

Le derivate f xy e f yx sono dette anche derivate parziali miste perchè le derivate sono fatte<br />

rispetto a più <strong>di</strong> una variabile.<br />

Osserviamo che, dal punto <strong>di</strong> vista della notazione usata, quando l’in<strong>di</strong>ce della derivata<br />

parziale è posta in basso della funzione, per esempio f xy , dobbiamo derivare da sinistra verso<br />

destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando<br />

invece usiamo la notazione frazionale ( ∂2 f<br />

) la notazione è opposta: si va da destra verso<br />

∂y∂x<br />

sinistra. Nell’esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y.<br />

Esempio<br />

Es. 3.5.1 Calcolare le derivate seconde <strong>di</strong> f(x, y) = sin (xy) − x 3 e 4y + 4y 2 .<br />

Prima <strong>di</strong> tutto calcoliamo le derivate parziali prime:<br />

f x (x, y) = y cos (xy) − 3x 2 e 4y<br />

f y (x, y) = x cos (xy) − 4x 3 e 4y + 8y<br />

Passiamo ora alle derivate seconde:<br />

f xx (x, y) = −y 2 sin (xy) − 6xe 4y<br />

f xy (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />

f yx (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />

f yy (x, y) = −x 2 sin (xy) − 16x 3 e 4y + 8<br />

Nell’esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta <strong>di</strong> una<br />

“coincidenza” o no In realtà la funzione data gode <strong>di</strong> una proprietà importante che ci<br />

permette <strong>di</strong> avere questo risultato.<br />

Teorema 3.5.1 (<strong>di</strong> Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che<br />

contiene il punto (x 0 , y 0 ), se le funzioni f xy e f yx sono continue in A, allora<br />

f xy (x 0 , y 0 ) = f yx (x 0 , y 0 ).<br />

3.6 Differenziabilità <strong>di</strong> una funzione<br />

Prima <strong>di</strong> entrare a parlare <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong> una funzione,<br />

introduciamo una<br />

notazione per <strong>degli</strong> spazi <strong>di</strong> funzioni definite in un insieme aperto I ⊂ R 2 .<br />

G Si in<strong>di</strong>ca con C 0 (I) l’insieme delle funzioni continue in I (si <strong>di</strong>ce anche che la funzione<br />

è <strong>di</strong> classe C 0 ).<br />

G Si in<strong>di</strong>ca con C 1 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime<br />

sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 1 ).<br />

G Si in<strong>di</strong>ca con C 2 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime e<br />

seconde sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 2 ).<br />

25


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Definizione 3.6.1 Sia data una funzione f : A −→ R con A ⊂ R 2 , A aperto, e un punto<br />

P 0 (x 0 , y 0 ) ∈ A. Diremo che f è <strong>di</strong>fferenziabile in P 0 se esistono due numeri reali λ e µ tali che<br />

f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />

lim<br />

√ = 0<br />

(x,y)→(x 0,y 0)<br />

(x − x0 ) 2 + (y − y 0 ) 2<br />

In maniera del tutto equivalente si può <strong>di</strong>re che f è <strong>di</strong>fferenziabile se<br />

f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />

è infinitesima <strong>di</strong> or<strong>di</strong>ne superiore rispetto all’infinitesimo √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Applicando la definizione <strong>di</strong> limite, <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 , vuol <strong>di</strong>re che, qualunque<br />

sia ɛ > 0 esiste δ > 0 tale che per ogni (x, y) ∈ A, con 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ<br />

risulta<br />

|f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )] | < ɛ √ (x − x 0 ) 2 + (y − y 0 ) 2<br />

In modo equivalente, possiamo anche <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 se esistono due<br />

numeri λ e µ e una funzione σ(x, y) definita in un intorno T <strong>di</strong> P 0 e infinitesima per (x, y) →<br />

(x 0 , y 0 ) tale che, per ogni (x, y) ∈ T , vale:<br />

f(x, y) − f(x 0 , y 0 ) = λ(x − x 0 ) + µ(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Vale la seguente proposizione.<br />

Proposizione 3.6.1 Se f : A −→ R, con A ⊂ R 2 , A aperto, è <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />

esistono le derivate parziali prime <strong>di</strong> f in P 0 e vale: f x (P 0 ) = λ e f y (P 0 ) = µ.<br />

Dimostrazione. Sappiamo che la f è <strong>di</strong>fferenziabile, dobbiamo provare che f x (P 0 ) = λ e<br />

f y (P 0 ) = µ.<br />

Fissiamo la variabile y, prendendo y = y 0 . Dalla definizione <strong>di</strong> <strong>di</strong>fferenziabilità si ha:<br />

f(x, y 0 ) − f(x 0 , y 0 ) = λ(x − x 0 ) + |x − x 0 |σ(x, y 0 )<br />

con σ la funzione infinitesima definita prima. Il termine che moltiplica µ si annulla (abbiamo<br />

y 0 − y 0 ) come pure √ (x − x 0 ) 2 + (y − y 0 ) 2 si riduce a |x − x 0 | per y = y 0 .<br />

Divi<strong>di</strong>amo la relazione trovata per x − x 0 , ricavando<br />

f(x, y 0 ) − f(x 0 , y 0 )<br />

x − x 0<br />

= λ + |x − x 0|<br />

x − x 0<br />

σ(x, y 0 )<br />

Passando al limite per x → x 0 , poichè σ(x, y 0 ) è infinitesima e |x − x 0|<br />

x − x 0<br />

funzione |x − x 0|<br />

σ(x, y 0 ) è ancora infinitesima. Quin<strong>di</strong> si ha<br />

x − x 0<br />

f(x, y 0 ) − f(x 0 , y 0 )<br />

lim<br />

= λ<br />

x→x 0 x − x 0<br />

è limitata (vale ±1), la<br />

Il limite che abbiamo calcolato rappresenta la derivata prima della funzione f(x, y 0 ) che<br />

<strong>di</strong>pende dalla sola variabile x, nel punto x 0 : essa è, quin<strong>di</strong>, la derivata parziale prima della f<br />

rispetto a x. Abbiamo ottenuto che f x (x 0 , y 0 ) = λ.<br />

Con lo stesso ragionamento, si prova che f y (x 0 , y 0 ) = µ. Si deve far variare il punto (x, y)<br />

su una retta parallela all’asse y, per x = x 0 . In tal caso, la definizione <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong><br />

dà:<br />

26<br />

f(x 0 , y) − f(x 0 , y 0 ) = µ(y − y 0 ) + |y − y 0 |σ(x 0 , y)


3.7. Differenziale<br />

Dividendo per y − y 0 si ha<br />

f(x 0 , y) − f(x 0 , y 0 )<br />

y − y 0<br />

= µ + |y − y 0|<br />

y − y 0<br />

σ(x 0 , y)<br />

Passando al limite per y → y 0 si ha che |y − y 0|<br />

y − y 0<br />

σ(x 0 , y) → 0 e quin<strong>di</strong><br />

f(x 0 , y) − f(x 0 , y 0 )<br />

lim<br />

= µ<br />

y→y 0 y − y 0<br />

vale a <strong>di</strong>re f y (x 0 , y 0 ) = µ.<br />

Quin<strong>di</strong> se f è <strong>di</strong>fferenziabile in P 0 , la f ammette le derivate parziali prime in P 0 e vale<br />

f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

✔<br />

Come conseguenza, una funzione <strong>di</strong>fferenziabile in P 0 è continua in P 0 .<br />

Proposizione 3.6.2 Sia f : A −→ R, con A aperto <strong>di</strong> R 2 . Sia f <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />

f è continua in P 0 .<br />

Dimostrazione. Poichè f è <strong>di</strong>fferenziabile in P 0 , esiste una funzione infinitesima per<br />

(x, y) → (x 0 , y 0 ) , σ(x, y) , tale che<br />

cioè<br />

f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Per (x, y) → (x 0 , y 0 ) il secondo membro della relazione appena scritta tende a zero, quin<strong>di</strong><br />

lim f(x, y) − f(x 0, y 0 ) = 0<br />

(x,y)→(x 0,y 0)<br />

lim f(x, y) = f(x 0, y 0 )<br />

(x,y)→(x 0,y 0)<br />

La f è continua in P 0 . ✔<br />

Teorema 3.6.1 Se f ∈ C 1 (A), con A aperto <strong>di</strong> R 2 , allora f è <strong>di</strong>fferenziabile in A.<br />

3.7 Differenziale<br />

Ricor<strong>di</strong>amo ora il concetto <strong>di</strong> <strong>di</strong>fferenziale <strong>di</strong> una funzione <strong>di</strong> una sola variabile.<br />

Definizione 3.7.1 Data una funzione f(x) e assumendo che la derivata f ′ (x) = df<br />

dx<br />

un punto x, il <strong>di</strong>fferenziale totale df della funzione è dato da<br />

( ) df<br />

df = dx = f ′ (x)dx.<br />

dx<br />

esiste in<br />

La quantità df può essere interpretata come il cambiamento infinitesimale del valore della<br />

funzione f(x) quando x cambia <strong>di</strong> una quantità infinitesima dx. Per esprimere questo da un<br />

punto <strong>di</strong> vista formale, consideriamo l’incremento ∆f = f(x + ∆x) − f(x) che rappresenta<br />

l’incremento sulla f quando x è incrementato <strong>di</strong> una quantità finita ∆x.<br />

27


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Applicando il teorema del valor me<strong>di</strong>o, possiamo riscrivere<br />

∆f = f ′ (x + θ∆x)∆x, dove θ ∈ (0, 1).<br />

Ora passando al limite per ∆x → dx, ∆f → df, essendo df un incremento infinitesimale.<br />

Dal momento che dx è molto piccolo, possiamo <strong>di</strong>re che dx ≪ x e quin<strong>di</strong> x + θdx ≈ x da cui<br />

df = f ′ (x)dx.<br />

Ritroviamo la formula data per il <strong>di</strong>fferenziale df.<br />

Qualcosa <strong>di</strong> simile si ritrova nelle funzioni <strong>di</strong> due variabili.<br />

Definizione 3.7.2 Data f(x, y) funzione <strong>di</strong> due variabili, con derivate parziali prime continue,<br />

si definisce <strong>di</strong>fferenziale totale della f<br />

( ) ( )<br />

∂f ∂f<br />

df = dx + dy = f x dx + f y dy.<br />

∂x ∂y<br />

Il <strong>di</strong>fferenziale df rappresenta la variazione della f quando le variabili x e y cambiano <strong>di</strong> una<br />

quantità infinitesima dx e dy.<br />

Per arrivare a questa formula, definiamo ∆f la variazione che si ha variando x e y <strong>di</strong> una<br />

quantità ∆x e ∆y rispettivamente.<br />

∆f = f(x + ∆x, y + ∆y) − f(x, y)<br />

aggiungiamo e sottraiamo f(x, y + ∆y)<br />

f(x + ∆x, y + ∆y) − f(x, y + ∆y) + f(x, y + ∆y) − f(x, y)<br />

} {{ } } {{ }<br />

incremento con y+∆y fissato incremento con x fissato<br />

Abbiamo sud<strong>di</strong>viso ∆f in due pezzi, il primo contenente una variazione solo in x e l’altro<br />

contenente una variazione solo in y. Applicando il teorema del valor me<strong>di</strong>o come prima,<br />

otteniamo<br />

∆f = f x (x + θ 1 ∆x, y + ∆y)∆x + f y (x, y + θ 2 ∆y)∆y con θ 1 , θ 2 ∈ (0, 1).<br />

Per ∆x → dx e per ∆y → dy, con dx e dy incrementi infinitesimali (da cui dx ≪ x e dy ≪ y),<br />

risulta che ∆f → f, ricavando l’espressione df = f x dx + f y dy.<br />

3.8 Derivata <strong>di</strong>rezionale<br />

La derivata <strong>di</strong>rezionale <strong>di</strong> una funzione permette <strong>di</strong> calcolare la velocità <strong>di</strong> variazione<br />

della funzione in una assegnata <strong>di</strong>rezione. Le derivate parziali rispetto a x e rispetto a y<br />

rappresentano la velocità <strong>di</strong> variazione lungo le <strong>di</strong>rezioni x e y rispettivamente. Supponiamo<br />

ora <strong>di</strong> voler calcolare come cambia una funzione f(x, y) nel punto (x 0 , y 0 ), lungo la <strong>di</strong>rezione<br />

<strong>di</strong> un arbitrario vettore unitario ⃗v <strong>di</strong> componenti α 1 e α 2 . Dire che ⃗v è unitario, significa che<br />

la norma euclidea del vettore vale uno, cioè (α 1 ) 2 + (α 2 ) 2 = 1.<br />

Geometricamente, se consideriamo la superficie <strong>di</strong> equazione z = f(x, y) (il grafico della<br />

f), il piano verticale che passa attraverso il punto (x 0 , y 0 , f(x 0 , y 0 )), nella <strong>di</strong>rezione data da<br />

⃗v, interseca la superficie in una curva. La pendenza della tangente alla curva nel punto<br />

(x 0 , y 0 , f(x 0 , y 0 )) rappresenta la velocità <strong>di</strong> variazione della f nella <strong>di</strong>rezione ⃗v, cioè la derivata<br />

<strong>di</strong>rezionale della f lungo ⃗v.<br />

Al fine <strong>di</strong> calcolare questa derivata <strong>di</strong>rezionale, consideriamo un punto P (x, y) che si trova<br />

sul piano xy lungo la retta passante per P 0 (x 0 , y 0 ) e avente <strong>di</strong>rezione data da ⃗v. La retta si<br />

28


3.8. Derivata <strong>di</strong>rezionale<br />

può scrivere come P = P 0 + h⃗v con h scalare. Ciò significa che le coor<strong>di</strong>nate del punto P si<br />

possono scrivere come<br />

x = x 0 + hα 1 y = y 0 + hα 2<br />

La variazione della f tra il punto P e il punto P 0 è data da f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 ).<br />

Definizione 3.8.1 Definiamo derivata <strong>di</strong>rezionale della f lungo la <strong>di</strong>rezione ⃗v il limite, se<br />

esiste ed è finito,<br />

f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />

lim<br />

h→0<br />

h<br />

Questo limite si in<strong>di</strong>ca in modo equivalente tramite la scrittura ∂f<br />

∂⃗v (x 0, y 0 ) o D ⃗v f(P 0 ).<br />

Dalla definizione data, risulta evidente che se ⃗v = ⃗i in<strong>di</strong>cando con ⃗i il versore unitario<br />

dell’asse x, <strong>di</strong> componenti (1, 0), allora D ⃗v f(P 0 ) = f x (P 0 ), mentre se ⃗v = ⃗j il versore unitario<br />

dell’asse y, <strong>di</strong> componenti (0, 1), allora D ⃗v f(P 0 ) = f y (P 0 ). Quin<strong>di</strong> le derivate parziali rispetto<br />

a x e rispetto a y sono un caso particolare <strong>di</strong> derivate <strong>di</strong>rezionali.<br />

Vale il seguente teorema, detto formula del gra<strong>di</strong>ente perchè la derivata <strong>di</strong>rezionale, sotto<br />

determinate con<strong>di</strong>zioni, è legata al gra<strong>di</strong>ente della funzione assegnata.<br />

Definizione 3.8.2 Data una funzione f che ammette derivate parziali in P 0 , il vettore in<strong>di</strong>cato<br />

con il simbolo ⃗ ∇f(P 0 ) o grad f(P 0 ) prende il nome <strong>di</strong> gra<strong>di</strong>ente della funzione in P 0 e ha come<br />

componenti le derivate parziali prime della f in P 0 :<br />

⃗∇f(P 0 ) = (f x (P 0 ), f y (P 0 )).<br />

Teorema 3.8.1 (Formula del gra<strong>di</strong>ente) Data f : A −→ R con A ⊂ R 2 , se f è <strong>di</strong>fferenziabile<br />

in P 0 (x 0 , y 0 ) allora f ammette derivata <strong>di</strong>rezionale lungo una qualsiasi <strong>di</strong>rezione unitaria<br />

⃗v(α 1 , α 2 ) e risulta<br />

∂f<br />

∂⃗v (P 0) = f x (P 0 )α 1 + f y (P 0 )α 2<br />

Quin<strong>di</strong> la derivata <strong>di</strong>rezionale si può vedere come il prodotto scalare tra il gra<strong>di</strong>ente della<br />

funzione in P 0 e il vettore ⃗v.<br />

∂f<br />

∂⃗v (P 0) = ⃗ ∇f(P 0 ) · ⃗v<br />

Dimostrazione.<br />

Poichè f è <strong>di</strong>fferenziabile, vale<br />

f(x, y) − f(x 0 , y 0 ) = f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2<br />

dove σ è una funzione infinitesima per (x, y) → (x 0 , y 0 ).<br />

Poichè devo calcolare la derivata <strong>di</strong>rezionale, considero come punto (x, y) il punto che si<br />

trova sulla retta passante per (x 0 , y 0 ) e avente <strong>di</strong>rezione data dal vettore ⃗v. Quin<strong>di</strong>, come<br />

prima, x = x 0 + hα 1 e y = y 0 + hα 2 .<br />

Sostituendo nella formula della <strong>di</strong>fferenziabilità si ricava:<br />

f(x 0 +hα 1 , y 0 +hα 2 )−f(x 0 , y 0 ) = f x (P 0 )(hα 1 )+f y (P 0 )(hα 2 )+σ(x 0 +hα 1 , y 0 +hα 2 ) √ h 2 (α 1 ) 2 + h 2 (α 2 ) 2<br />

Divi<strong>di</strong>amo ambo i membri per h, ricordando anche che, poichè il vettore è unitario, si ha<br />

√<br />

h2 (α 1 ) 2 + h 2 (α 2 ) 2 = |h| √ (α 1 ) 2 + (α 2 ) 2 = |h|. Quin<strong>di</strong> si ottiene:<br />

f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />

h<br />

= f x (P 0 )α 1 + f y (P 0 )α 2 + |h|<br />

h σ(x 0 + hα 1 , y 0 + hα 2 )<br />

29


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Passando al limite per h → 0, a primo membro si ha proprio il limite della definizione <strong>di</strong><br />

derivata <strong>di</strong>rezionale lungo ⃗v, mentre a secondo membro si ottiene f x (P 0 )α 1 + f y (P 0 )α 2 in<br />

quanto la quantità |h|<br />

h σ(x 0 + hα 1 , y 0 + hα 2 ) tende a 0 poichè è prodotto <strong>di</strong> un infinitesimo (la<br />

funzione σ) per la costante |h|<br />

h = ±1).<br />

Si ricava quin<strong>di</strong> l’asserto. ✔<br />

3.9 Derivazione nelle funzioni composte<br />

Per funzioni scalari, è frequente avere a che fare con funzioni del tipo y = f(x) dove però<br />

x è a sua volta funzione <strong>di</strong> un’altra variabile t, x = g(t).<br />

Se scriviamo F (t) = f(g(t)), sappiamo che F ′ (t) = f ′ (g(t))g ′ (t): applichiamo la regola <strong>di</strong><br />

derivazione sulle funzioni composte.<br />

C’è una notazione alternativa a questa: da y = f(x) con x = g(t), abbiamo<br />

dy<br />

dt = dy dx<br />

dx dt .<br />

Per funzioni <strong>di</strong> più variabili, abbiamo <strong>di</strong>versi casi da considerare. Ne consideriamo i<br />

principali.<br />

G Primo caso: Sia z = f(x, y) con x = g(t) e y = h(t). Supponiamo che la f sia una<br />

funzione <strong>di</strong>fferenziabile <strong>di</strong> (x, y) e che g e h siano funzioni <strong>di</strong>fferenziabili <strong>di</strong> t. Allora z è<br />

una funzione <strong>di</strong>fferenziabile <strong>di</strong> t e si ha<br />

30<br />

dz<br />

dt = ∂f dx<br />

∂x dt + ∂f dy<br />

∂y dt<br />

Osserviamo che la derivata <strong>di</strong> z rispetto a t è una derivata totale.<br />

Esempio<br />

Es. 3.9.1 Sia z = f(x, y) = x 3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo dz<br />

dt<br />

applicando la formula. Poichè ∂f<br />

∂x = 3x2 y + 3y 2 , ∂f<br />

∂y = x3 + 6xy, dx = 2 cos (2t) e<br />

dt<br />

dy<br />

= − sin (t), ricaviamo:<br />

dt<br />

dz<br />

dt = (3x2 y + 3y 2 )2 cos (2t) + (x 3 + 6xy)(− sin (t))<br />

A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x<br />

e y in funzione <strong>di</strong> t:<br />

dz<br />

dt = (3 sin2 (2t) cos (t) + 3 cos 2 (t))2 cos (2t) + (sin 3 (2t) + 6 sin (2t) cos (t)(− sin (t))<br />

e sistemando meglio i termini a destra ricaviamo<br />

dz<br />

dt = 6(sin2 (2t) cos (2t) cos (t)+cos 2 (t) cos (2t))−(sin 2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)).<br />

G Secondo caso: : z = f(x, y) con x = g(s, t) e y = h(s, t). Le funzioni f, g e h siano<br />

<strong>di</strong>fferenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s<br />

e t. Otteniamo<br />

∂z<br />

∂s = ∂f ∂x<br />

∂x ∂s + ∂f ∂y<br />

∂y ∂s<br />

∂z<br />

∂t = ∂f ∂x<br />

∂x ∂t + ∂f ∂y<br />

∂y ∂t


3.10. Piano tangente ad una superficie<br />

Esempio<br />

Es. 3.9.2 Sia z = f(x, y) = e 2x sin (y) con x = st e y = s 2 t.<br />

In tal caso, applicando la formula abbiamo:<br />

∂z<br />

∂s = 2e2x sin (y)t + e 2x cos (y)(2s) = 2e 2st (t sin (s 2 t) + s cos (s 2 t))<br />

∂z<br />

∂t = 2e2x sin (y)s + e 2x cos (y)s 2 = se 2st (2 sin (s 2 t) + s cos (s 2 t))<br />

3.10 Piano tangente ad una superficie<br />

Per funzioni <strong>di</strong> una variabile, se facciamo uno zoom intorno ad un punto del grafico <strong>di</strong><br />

una funzione <strong>di</strong>fferenziabile, il grafico si <strong>di</strong>scosta <strong>di</strong> poco dalla sua retta tangente in quel<br />

punto e possiamo approssimare la funzione, in un intorno del punto, tramite l’equazione <strong>di</strong><br />

una retta.<br />

Un <strong>di</strong>scorso simile si può sviluppare per funzioni <strong>di</strong> due variabili. Qui lo zoom si deve<br />

fare intorno ad un punto della superficie che rappresenta il grafico <strong>di</strong> una funzione <strong>di</strong>fferenziabile.<br />

E il grafico si <strong>di</strong>scosterà poco da un piano (il suo piano tangente in quel punto),<br />

così che potremo approssimare la funzione, in un intorno del punto, tramite l’equazione del<br />

piano tangente.<br />

Sia S la superficie dell’equazione z = f(x, y), con f <strong>di</strong>fferenziabile e <strong>di</strong> classe C 1 . Sia<br />

P 0 (x 0 , y 0 , f(x 0 , y 0 ) un punto <strong>di</strong> S. Consideriamo le curve che intersecano i piani verticali<br />

y = y 0 e x = x 0 sulla superficie S. Il punto <strong>di</strong> intersezione della due curve è proprio il punto<br />

P 0 . Siano T 1 e T 2 le rette tangenti alle due curve nel punto P 0 (le pendenze <strong>di</strong> queste rette<br />

sono date dalle derivate parziali rispetto a x e y). Allora il piano tangente alla superficie<br />

S nel punto P 0 è definito come il piano che contiente entrambe le rette tangenti T 1 e T 2 .<br />

Possiamo pensare a questo piano tangente come il piano in cui ci sono tutte le possibili<br />

rette tangenti per P 0 alle curve che giacciono su S e passano attraverso P 0 (considerando le<br />

derivate <strong>di</strong>rezionali). Il piano tangente è quin<strong>di</strong> il piano che più approssima la superficie S<br />

intorno al punto P 0 .<br />

Un piano passante per il punto P 0 ha equazione nella forma<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − f(x 0 , y 0 )) = 0<br />

Dividendo per c e ponendo A = −a/c e B = −b/c, possiamo scrivere<br />

z − f(x 0 , y 0 ) = A(x − x 0 ) + B(y − y 0 )<br />

Se questa equazione deve rappresentare l’equazione del piano tangente a P 0 sulla superficie,<br />

vuol <strong>di</strong>re che l’intersezione con il piano y = y 0 deve essere la retta tangente T 1 . Ponendo<br />

y = y 0 , l’equazione si riduce a<br />

z − f(x 0 , y 0 ) = A(x − x 0 ), y = y 0<br />

Ora questa è l’equazione <strong>di</strong> una retta che ha pendenza A. Ma la pendenza della tangente T 1<br />

è f x (x 0 , y 0 ). Perciò A = f x (x 0 , y 0 ).<br />

Allo stesso modo, considerando il piano x = x 0 , il piano tangente si riduce a<br />

z − f(x 0 , y 0 ) = B(y − y 0 ), x = x 0<br />

che rappresenta la retta tangente T 2 con pendenza B = f y (x 0 , y 0 ).<br />

Quin<strong>di</strong> l’equazione del piano tangente è data da<br />

z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ).<br />

31


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

3.11 Formula <strong>di</strong> Taylor<br />

Quando si considerano funzioni scalari <strong>di</strong>fferenziabili e continue, la formula <strong>di</strong> Taylor è<br />

utile per approssimare la funzione in un intorno <strong>di</strong> un punto. Data la funzione f(x) e x 0 un<br />

punto che appartiene all’insieme <strong>di</strong> definizione della f, possiamo scrivere:<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />

f ′′ (ξ x )<br />

2<br />

dove ξ x è un punto che si trova nell’insieme <strong>di</strong> definizione della f ed è compreso tra x e x 0 .<br />

La formula appena scritta prende il nome <strong>di</strong> formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 e permette <strong>di</strong><br />

approssimare la funzione f(x) in un intorno <strong>di</strong> x 0 utlizzando i valori della funzione in x 0 . Il<br />

polinomio T 1 (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) è il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado. In questo caso<br />

rappresenta la retta tangente alla funzione f nel punto x 0 . Se noi approssiamo f(x) me<strong>di</strong>ante<br />

il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado, commettiamo un errore dato da R 1 (x) = (x − x 0) 2<br />

f ′′ (ξ x ),<br />

2<br />

che possiamo maggiorare, in valore assoluto, considerando M = max |f ′′ (x)| per x che varia<br />

nell’insieme <strong>di</strong> definizione della f, ottenendo | (x − x 0) 2<br />

f ′′ (ξ x )| ≤ |M (x − x 0) 2<br />

|, un errore del<br />

2<br />

2<br />

secondo or<strong>di</strong>ne.<br />

In generale, il polinomio <strong>di</strong> Taylor <strong>di</strong> grado n è dato da<br />

T n (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />

2!<br />

(x − x 0 ) 2 + f (3) (x 0 )<br />

3!<br />

(x − x 0 ) 3 + . . . + f (n) (x 0 )<br />

(x − x 0 ) n<br />

n!<br />

Se approssimiamo f(x) con il polinomio <strong>di</strong> Taylor T n (x), l’errore che si commette è <strong>di</strong> or<strong>di</strong>ne<br />

n + 1, poichè vale R n (x) = f (n+1) (ξ x )<br />

(x − x 0 ) n+1 .<br />

(n + 1)!<br />

Nel caso <strong>di</strong> funzioni <strong>di</strong> più variabili, il polinomio <strong>di</strong> Taylor deve considerare le derivate<br />

parziali della funzioni.<br />

Teorema 3.11.1 Consideriamo una funzione f(x, y) <strong>di</strong> classe C 2 . Allora per ogni punto P 0<br />

nell’insieme <strong>di</strong> definizione della f, vale la formula <strong>di</strong> Taylor data da<br />

f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />

Se approssimiamo la funzione f(x, y) con il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado dato da<br />

T 1 (x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

commettiamo un errore dato da<br />

R 1 (x) = 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

che è un errore del secondo or<strong>di</strong>ne (abbiamo infatti le potenze (x − x 0 ) 2 , (x − x 0 )(y − y 0 ),<br />

(y − y 0 ) 2 ).<br />

Osserviamo che il polinomio <strong>di</strong> Taylor T 1 (x, y) altro non è che l’equazione del piano<br />

tangente alla superficie della funzione f(x, y) nel punto (x 0 , y 0 , f(x 0 , y 0 )).<br />

Se consideriamo il polinomio <strong>di</strong> Taylor <strong>di</strong> or<strong>di</strong>ne zero per approssimare la funzione f(x, y),<br />

abbiamo il cosidetto teorema <strong>di</strong> Lagrange.<br />

32


3.11. Formula <strong>di</strong> Taylor<br />

Teorema 3.11.2 (<strong>di</strong> Lagrange) Data f : A −→ R con A ⊂ R 2 , f <strong>di</strong> classe C 1 , e dato P 0 (x 0 , y 0 ) ∈<br />

A, si ha<br />

f(x, y) = f(x 0 , y 0 ) + f x (ξ x , η y )(x − x 0 ) + f y (ξ x , η y )(y − y 0 )<br />

dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />

33


CAPITOLO 4<br />

Massimi e minimi<br />

La maggior parte delle idee<br />

fondamentali della scienza<br />

sono essenzialmente semplici,<br />

e possono, come una regola,<br />

essere espresse in un<br />

linguaggio comprensibile a<br />

tutti.<br />

Albert Einstein (1879-1955)<br />

4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . . 47<br />

4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . . 52<br />

4.1 Forme quadratiche<br />

Prima <strong>di</strong> passare a definire i massimi e minimi <strong>di</strong> una funzione <strong>di</strong> più variabili, ci conviene<br />

introdurre il concetto <strong>di</strong> forma quadratica perchè ci servirà per poter calcolare i massimi e i<br />

minimi.<br />

Nello spazio R 2 , una forma quadratica è un polinomio omogeneo <strong>di</strong> secondo grado nelle<br />

variabili x e y. Ad esempio, F (x, y) = 3x 2 + 5xy + 2y 2 o F (x, y) = x 2 + 10xy − 7y 2 sono forme<br />

quadratiche.<br />

Una forma quadratica si può scrivere utilizzando prodotti <strong>di</strong> matrici e vettori come<br />

F (x, y) = ( x y ) ( ) ( )<br />

a 11 a 12 x<br />

a 21 a 22 y<br />

dove il vettore <strong>di</strong> componenti ( (x, y) ) è scritto prima come vettore riga e poi come vettore<br />

a11 a<br />

colonna. La matrice A =<br />

12<br />

è la matrice dei coefficienti della forma quadratica.<br />

a 21 a 22<br />

Eseguendo il prodotto <strong>di</strong> A con il vettore colonna (x, y) otteniamo:<br />

( ) ( ) ( )<br />

a11 a 12 x a11 x + a<br />

=<br />

12 y<br />

a 22 y a 21 x + a 22 y<br />

a 21<br />

35


4. MASSIMI E MINIMI<br />

Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo<br />

un prodotto scalare tra vettori) ricavando:<br />

( ) ( )<br />

a x y 11 x + a 12 y<br />

= x(a<br />

a 21 x + a 22 y<br />

11 x + a 12 y) + y(a 21 x + a 22 y) = a 11 x 2 + a 12 xy + a 21 xy + a 22 y 2<br />

In definitiva, abbiamo F (x, y) = a 11 x 2 + (a 12 + a 21 )xy + a 22 y 2 .<br />

La matrice dei coefficienti della forma quadratica si può scrivere come una matrice simmetrica<br />

(con a 12 = a 21 ). Se così non fosse, la si può rendere simmetrica prendendo come<br />

coefficiente <strong>di</strong> riga 1 e colonna 2 (e <strong>di</strong> riga 2 e colonna( 1) la semisomma ) dei valori a 12 e a 21<br />

a12 + a 21<br />

della matrice non simmetrica: vale infatti a 12 + a 21 = 2<br />

.<br />

2<br />

Esempio<br />

Es. 4.1.1 Sia F (x, y) = x 2 + 10xy − 7y 2 . Possiamo scrivere questa forma quadratica in<br />

forma matriciale ponendo A in forma non simmetrica:<br />

F (x, y) = ( x y ) ( ( )<br />

1 2 x<br />

8 −7)<br />

y<br />

oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi<br />

extra <strong>di</strong>agonali la semisomma dei corrispondenti elementi della matrice non simmetrica<br />

F (x, y) = ( x y ) ( ( )<br />

1 5 x<br />

5 −7)<br />

y<br />

In entrambi i casi, il risultato è sempre lo stesso, la forma quadratica F (x, y) = x 2 +10xy −<br />

7y 2 .<br />

In generale, una forma quadratica in R 2 viene rappresentata utilizzando una matrice<br />

simmetrica nella forma<br />

F (x, y) = ( x y ) ( ( )<br />

a b x<br />

b c)<br />

y<br />

da cui<br />

F (x, y) = ax 2 + 2bxy + cy 2 .<br />

Nel caso dello spazio R n<br />

seguente.<br />

si generalizza la definizione <strong>di</strong> forma quadratica nel modo<br />

Definizione 4.1.1 Una forma quadratica in R n è un polinomio omogeneo <strong>di</strong> secondo grado<br />

nelle n variabili x 1 , x 2 , . . . , x n , a coefficienti reali. Una forma quadratica si può scrivere come<br />

F (x 1 , x 2 , . . . , x n ) =<br />

n∑<br />

a ij x i x j<br />

i,j=1<br />

In forma matriciale si può scrivere come<br />

⎛<br />

⎞<br />

a 11 a 12 . . . a<br />

⎛ ⎞<br />

1n<br />

F (x 1 , x 2 , . . . , x n ) = ( x 1<br />

)<br />

a 21 a 22 . . . a 2n<br />

x 1 x 2 . . . x n ⎜<br />

⎟ ⎜x 2<br />

⎟<br />

⎝ . . . . . . ⎠ ⎝. . . ⎠<br />

a n1 a n2 . . . a nn<br />

x n<br />

36


4.1. Forme quadratiche<br />

Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come<br />

abbiamo visto in R 2 .<br />

Torniamo ora a considerare forme quadratiche in R 2 visto che lavoreremo soprattutto in<br />

questo spazio.<br />

Definizione 4.1.2 Una forma quadratica F (x, y) si <strong>di</strong>ce<br />

G definita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) > 0;<br />

G semidefinita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) ≥ 0;<br />

G definita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) < 0;<br />

G semidefinita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) ≤ 0;<br />

G indefinita se esistono almeno due punti (x 1 , y 1 ) e (x 2 , y 2 ) tali che F (x 1 , y 1 ) > 0 e F (x 2 , y 2 ) <<br />

0.<br />

Come fare a capire se una forma quadratica è definita positiva, negativa o indefinita<br />

Abbiamo il seguente teorema.<br />

Teorema 4.1.1 Data la forma quadrata F (x, y) = ax 2 + 2bxy + cy 2 :<br />

G se det(A) = ac − b 2 > 0 e a > 0 allora F (x, y) è definita positiva;<br />

G se det(A) = ac − b 2 > 0 e a < 0 allora F (x, y) è definita negativa;<br />

G se det(A) = ac − b 2 < 0 allora F (x, y) è indefinita.<br />

Vale anche il viceversa:<br />

G se F (x, y) è definita positiva allora det(A) = ac − b 2 > 0 e a > 0;<br />

G se F (x, y) è definita negativa allora det(A) = ac − b 2 > 0 e a < 0;<br />

G se F (x, y) è indefinita allora det(A) = ac − b 2 < 0.<br />

Dimostrazione. Ricor<strong>di</strong>amo innanzitutto che det(A) rappresenta il determinante della<br />

matrice A che caratterizza la forma quadratica e che vale det(A) = ac − b 2 .<br />

Scriviamo ora la forma quadratica mettendo in evidenza il coefficiente a e aggiungendo e<br />

sottraendo b2<br />

a 2 y2 , otteniamo:<br />

F (x, y) = ax 2 + 2bxy + cy 2<br />

= a<br />

(x 2 + 2 b a xy + c )<br />

a y2<br />

= a<br />

(x 2 + 2 b b2<br />

xy +<br />

a a 2 y2 − b2<br />

a 2 y2 + c )<br />

a y2<br />

Osserviamo che x 2 + 2 b b2<br />

xy +<br />

a a 2 y2 = (x + b a y)2 . Inoltre − b2<br />

a 2 y2 + c a y2 =<br />

Abbiamo dunque<br />

F (x, y) = a<br />

((x + b )<br />

ac −<br />

a y)2 b2<br />

+<br />

a 2 y 2<br />

ac − b2<br />

a 2 y 2 .<br />

La forma quadratica è dunque data dal prodotto <strong>di</strong> a per la somma <strong>di</strong> due termini: il termine<br />

(x + b ac −<br />

a y)2 b2<br />

è il quadrato <strong>di</strong> un binomio ed è sempre positivo; il termine<br />

a 2 y 2 può essere<br />

positivo o negativo a seconda del segno <strong>di</strong> ac − b 2 .<br />

Se a > 0 e ac − b 2 > 0 allora la forma quadratica è sempre maggiore <strong>di</strong> zero e quin<strong>di</strong> è<br />

definita positiva.<br />

Se a < 0 e ac − b 2 > 0, la forma quadratica è definita negativa.<br />

Se invece ac − b 2 < 0 possiamo avere valori <strong>di</strong> (x, y) per cui la forma quadratica è positiva<br />

e altri valori per cui la forma quadratica è negativa.<br />

37


4. MASSIMI E MINIMI<br />

Viceversa, supponiamo che la F sia definita positiva, negativa o indefinita. Mettiamo in<br />

evidenza il termine y 2 nella forma quadratica. Si ha<br />

(<br />

)<br />

F (x, y) = y 2 a x2<br />

y 2 + 2bx y + c<br />

Poniamo t = x y<br />

in modo da poter scrivere<br />

F (x, y) = y 2 (at 2 + 2bt + c)<br />

Supponiamo che la forma quadratica sia definita positiva: vuol <strong>di</strong>re che y 2 (at 2 + 2bt + c) > 0<br />

per ogni coppia (x, y) ≠ (0, 0), quin<strong>di</strong> deve essere at 2 + 2bt + c > 0 per ogni t: questo si ha con<br />

a > 0 e con il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t negativo, cioè 4b 2 − 4ac < 0,<br />

vale a <strong>di</strong>re ac − b 2 > 0.<br />

Se invece la forma quadratica è definita negativa, vuol <strong>di</strong>re che at 2 + 2bt + c < 0 per ogni<br />

valore <strong>di</strong> t, quin<strong>di</strong> deve essere a < 0 e il <strong>di</strong>scriminante negativo, quin<strong>di</strong> ancora ac − b 2 > 0.<br />

Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori<br />

negativi, perciò il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t deve essere positivo,<br />

cioè ac − b 2 < 0. 1 ✔<br />

Nel caso <strong>di</strong> forme quadratiche in R n , l’analogo teorema per vedere se una forma quadratica<br />

è definita positiva, negativa o indefinita è dato dal teorema <strong>di</strong> Sylvester, che considera i<br />

determinanti <strong>di</strong> tutti i minori principali delle matrice A che definisce la forma quadratica.<br />

Definizione 4.1.3 Data A matrice <strong>di</strong> n righe e n colonne, si definisce minore principale <strong>di</strong><br />

or<strong>di</strong>ne k e si in<strong>di</strong>ca con A k la matrice che si forma dalla matrice A prendendo le prime k righe<br />

e k colonne della matrice stessa.<br />

⎛<br />

Quin<strong>di</strong> A 1 = (a 11 ), A 2 =<br />

( )<br />

a11 a 12<br />

, A<br />

a 21 a k =<br />

22<br />

⎞<br />

a 11 a 12 . . . a 1k<br />

a 21 a 22 . . . a 2k<br />

⎜<br />

⎟<br />

⎝ . . . . . . ⎠ .<br />

a k1 a k2 . . . a kk<br />

Teorema 4.1.2 (<strong>di</strong> Sylvester) Data una forma quadratica in R n , F (x 1 , x 2 , . . . , x n ) =<br />

∑ n<br />

i,j=1 a ijx i x j , allora<br />

G F è definita positiva se e solo se det(A k ) > 0 per ogni k = 1, 2, . . . , n;<br />

G F è definita negativa se e solo se (−1) k det(A k ) > 0 per ogni k = 1, 2, . . . , n.<br />

1 Per la seconda parte <strong>di</strong> questo teorema ci siamo rifatti alle note proprietà:<br />

G ax 2 + bx + c = 0<br />

– se ∆ = b 2 − 4ac < 0 ⇒ non esistono ra<strong>di</strong>ci reali all’equazione;<br />

– se ∆ = 0 ⇒ le ra<strong>di</strong>ci sono coincidenti x 1 = x 2 = −b<br />

2a ;<br />

– se ∆ > 0 ⇒ esistono due ra<strong>di</strong>ci reali e <strong>di</strong>stinte date da −b ± √ ∆<br />

.<br />

2a<br />

G ax 2 + bx + c > 0, a > 0<br />

– se ∆ = b 2 − 4ac < 0 ⇒ l’insieme delle soluzioni che sod<strong>di</strong>sfano la <strong>di</strong>sequazione data è tutto R<br />

– se ∆ = 0 ⇒ l’insieme delle soluzioni è tutto R privato della ra<strong>di</strong>ce dell’equazione ax 2 + bx + c = 0<br />

– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori esterni all’intervallo delle due ra<strong>di</strong>ci dell’equazione<br />

<strong>di</strong> secondo grado.<br />

G ax 2 + bx + c < 0, a > 0<br />

– se ∆ ≤ 0 ⇒ non ci sono soluzioni per questa <strong>di</strong>sequazione;<br />

– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori interni all’intervallo delle due ra<strong>di</strong>ci dell’equazione.<br />

38


4.2. Massimi e minimi<br />

4.2 Massimi e minimi<br />

Per funzioni scalari, le derivate della funzione aiutano a capire e a trovare i suoi valori<br />

massimi e minimi e i punti in cui la funzione assume tali valori. Per funzioni <strong>di</strong> due variabili,<br />

sono <strong>di</strong> aiuto le derivate parziali.<br />

Definizione 4.2.1 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />

I ⊂ R 2 .<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />

f(x, y) ≤ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

massimo assoluto della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />

f(x, y) < f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 )<br />

si <strong>di</strong>ce massimo assoluto proprio della funzione.<br />

Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo assoluto e minimo<br />

assoluto proprio.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />

f(x, y) ≥ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

minimo assoluto della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />

f(x, y) > f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />

<strong>di</strong>ce minimo assoluto proprio della funzione.<br />

Se queste definizioni valgono non in tutto l’insieme <strong>di</strong> definizione della funzione f ma localmente,<br />

in un intorno <strong>di</strong> P 0 , allora si ottengono le definizioni <strong>di</strong> punto <strong>di</strong> massimo (o minimo)<br />

relativo (o relativo proprio).<br />

Definizione 4.2.2 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />

I ⊂ R 2 .<br />

G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />

ogni P (x, y) ∈ A r (P 0 ), risulta<br />

f(x, y) ≤ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

massimo relativo della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />

ogni P (x, y) ∈ A r (P 0 ), P ≠ P 0 , risulta<br />

f(x, y) < f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />

<strong>di</strong>ce massimo relativo della funzione.<br />

39


4. MASSIMI E MINIMI<br />

Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo relativo e minimo<br />

relativo proprio.<br />

Definizione 4.2.3 I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si<br />

chiamano anche estremi (assoluti e relativi) della funzione.<br />

Un punto <strong>di</strong> estremo relativo interno all’insieme <strong>di</strong> definizione della funzione f si chiama<br />

punto <strong>di</strong> estremo relativo interno.<br />

Teorema 4.2.1 Se una funzione f : I −→ R, con I ⊂ R 2 , I aperto, f ∈ C 1 (I), ammette un<br />

punto <strong>di</strong> massimo o minimo relativo interno nel punto P 0 (x 0 , y 0 ) allora esistono le derivate<br />

parziali della f in P 0 e vale f x (P 0 ) = f y (P 0 ) = 0<br />

Dimostrazione. Sia P 0 (x 0 , y 0 ) un punto <strong>di</strong> massimo (o minimo) relativo interno. Poniamo<br />

g(x) = f(x, y 0 ). Come conseguenza la funzione g ammette in x = x 0 un punto <strong>di</strong> massimo (o<br />

minimo) relativo interno e, quin<strong>di</strong>, g ′ (x 0 ) = 0. Ma g ′ (x 0 ) = f x (x 0 , y 0 ). Perciò vale f x (x 0 , y 0 ) = 0.<br />

Allo stesso modo, posto h(y) = f(x 0 , y), si ha che y 0 è punto <strong>di</strong> massimo (o minimo) relativo<br />

interno per la funzione h, da cui h ′ (y 0 ) = 0. Ma h ′ (y 0 ) = f y (x 0 , y 0 ) e quin<strong>di</strong> f y (x 0 , y 0 ) = 0. ✔<br />

Perciò, se P 0 è un punto <strong>di</strong> estremo relativo interno per la funzione f, necessariamente il<br />

gra<strong>di</strong>ente della f in P 0 è il vettore nullo:<br />

⃗∇(f)(P 0 ) = (00).<br />

Non vale il viceversa, tuttavia se dobbiamo cercare i punti <strong>di</strong> massimo e minimo relativo<br />

interni all’insieme <strong>di</strong> definizione <strong>di</strong> una funzione, dobbiamo analizzare quei punti che hanno<br />

il gra<strong>di</strong>ente nullo perchè tra questi ci saranno i punti <strong>di</strong> massimo e minimo relativi. Se<br />

l’insieme <strong>di</strong> definizione della funzione è un insieme aperto, i punti <strong>di</strong> massimo e minimo<br />

relativo sono tutti punti interni all’insieme <strong>di</strong> definizione.<br />

Vale la seguente definizione.<br />

Definizione 4.2.4 Un punto P 0 (x 0 , y 0 ) tale che ∇(f)(P ⃗ 0 ) = (00) si <strong>di</strong>ce punto critico (o<br />

stazionario) della funzione f.<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi<br />

Per capire se una funzione ha un punto <strong>di</strong> massimo o minimo relativo in un suo punto<br />

critico, viene in aiuto il cosiddetto test sulle derivate seconde. A tale scopo introduciamo la<br />

seguente definizione.<br />

Definizione 4.3.1 Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I aperto, e dato un punto P 0 ∈ I,<br />

si definisce hessiano della f in P 0 il determinante H f (P 0 ) della matrice<br />

( )<br />

fxx (P 0 ) f xy (P 0 )<br />

f xy (P 0 ) f yy (P 0 )<br />

Poichè la funzione è <strong>di</strong> classe C 2 , vale f xy = f yx .<br />

Quin<strong>di</strong><br />

H f (P 0 ) =<br />

∣ f xx(P 0 ) f xy (P 0 )<br />

f xy (P 0 ) f yy (P 0 ) ∣ = f xx(P 0 )f yy (P 0 ) − (f xy (P 0 )) 2<br />

Teorema 4.3.1 (Test sulle derivate seconde) Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I<br />

aperto, e dato P 0 punto critico per f, avente come hessiano H f (P 0 ) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2 ,<br />

si ha:<br />

40


4.3. Ricerca <strong>di</strong> massimi e minimi relativi<br />

G se H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora P 0 è un punto <strong>di</strong> minimo relativo interno proprio e f(P 0 )<br />

è un valore <strong>di</strong> minimo relativo;<br />

G se H f (P 0 ) > 0 e f xx (P 0 ) < 0, allora P 0 è un punto <strong>di</strong> massimo relativo interno proprio e<br />

f(P 0 ) è un valore <strong>di</strong> massimo relativo;<br />

G se H f (P 0 ) < 0 allora P 0 non è nè punto <strong>di</strong> massimo nè punto <strong>di</strong> minimo relativo e si chiama<br />

punto <strong>di</strong> sella.<br />

Osserviamo che se vale H f (P 0 ) = 0, P 0 può essere punto <strong>di</strong> minimo, massimo o <strong>di</strong> sella: bisogna<br />

indagare caso per caso.<br />

Dimostrazione. Per <strong>di</strong>mostrare questo teorema, applichiamo la formula <strong>di</strong> Taylor <strong>di</strong><br />

centro P 0 alla funzione f:<br />

f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

Considerando x = x 0 + h e y = y 0 + k, poichè P 0 è un punto critico, la formula si riduce a<br />

f(x 0 + h, y 0 + k) = f(x 0 , y 0 ) + 1 2 f xx(ξ x , η y )h 2 + f xy (ξ x , η y )hk + 1 2 f yy(ξ x , η y )k 2<br />

= f(x 0 , y 0 ) + 1 2<br />

(<br />

fxx (ξ x , η y )h 2 + 2f xy (ξ x , η y )hk + f yy (ξ x , η y )k 2)<br />

dove (ξ x , η y ) è un punto che non conosciamo, sul segmento <strong>di</strong> estremi P e P 0 .<br />

In un opportuno intorno <strong>di</strong> P 0 , per il teorema della permanenza del segno, se vale<br />

f xx (x 0 , y 0 ) > 0 vale anche f xx (x, y) > 0 nell’intorno <strong>di</strong> P 0 . Alla stessa maniera, sempre per<br />

lo stesso teorema sulla permanenza del segno, se H f (P 0 ) > 0 anche H f (P ) > 0 nell’intorno <strong>di</strong><br />

P 0 .<br />

Supponiamo, allora <strong>di</strong> trovarci nelle ipotesi in cui H f (P 0 ) > 0 e f xx (P 0 ) > 0. Allora la forma<br />

quadratica data da<br />

F 0 (h, k) = f xx (P 0 )h 2 + 2f xy (P 0 )hk + f yy (P 0 )k 2<br />

ha il determinante della matrice ad essa associata che vale det(A) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2<br />

cioè det(A) = H f (P 0 ). Poichè per ipotesi, H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora la forma quadratica<br />

è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno<br />

intorno <strong>di</strong> P 0 , considerando il punto (ξ x , η x ) della formula <strong>di</strong> Taylor: la forma quadratica<br />

data da F ξ,η (h, k) = f xx (ξ x , η y )h 2 +2f xy (ξ x , η y )hk +f yy (ξ x , η y )k 2 è una forma quadratica positiva,<br />

cioè F ξ,η (h, k) > 0. Riprendendo la formula <strong>di</strong> Taylor, in un intorno <strong>di</strong> P 0 risulta quin<strong>di</strong><br />

da cui<br />

cioè<br />

f(x, y) = f(x 0 , y 0 ) + 1 2 F ξ,η(h, k)<br />

f(x, y) − f(x 0 , y 0 ) = 1 2 F ξ,η(h, k) > 0<br />

f(x, y) > f(x 0 , y 0 ).<br />

Il punto P 0 è perciò un punto <strong>di</strong> minimo relativo proprio.<br />

Analogamente si provano gli altri due casi: se l’hessiano in P 0 è positivo e f xx (P 0 ) < 0<br />

allora la forma quadratica associata è definita negativa e, dalla formula <strong>di</strong> Taylor, risulta<br />

che P 0 è un punto <strong>di</strong> massimo relativo. Se invece l’hessiano è negativo, la forma quadratica<br />

41


4. MASSIMI E MINIMI<br />

Figura 4.1: Grafico della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />

associata è indefinita e quin<strong>di</strong> P 0 non può essere nè <strong>di</strong> massimo nè <strong>di</strong> minimo, ma è un<br />

punto <strong>di</strong> sella. ✔<br />

Esempio<br />

Es. 4.3.1 Calcolare i punti <strong>di</strong> massimo e minimo relativo e i corrispondenti valori <strong>di</strong><br />

massimo e minimo della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />

Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole<br />

uguali a zero:<br />

{<br />

f x (x, y) = 4x 3 − 4y = 0<br />

f y (x, y) = 4y 3 − 4x = 0<br />

Dalla prima equazione abbiamo y = x 3 e sostituendo nella seconda equazione ricaviamo<br />

0 = 4(x 9 −x) = 4x(x 8 −1) = 4x(x 4 −1)(x 4 +1) = 4x(x 2 −1)(x 2 +1)(x 4 +1) = 4x(x−1)(x+1)(x 2 +1)(x 4 +1)<br />

Le ra<strong>di</strong>ci reali sono tre x = 0, x = 1, x = −1, che, insieme alla relazione y = x 3 , ci danno i<br />

tre punti critici P 0 (0, 0), P 1 (1, 1) e P 2 (−1, −1).<br />

Per ciascuno <strong>di</strong> questi punti critici applichiamo il teorema del test sulle derivate seconde.<br />

In questo caso le derivate parziali seconde sono:<br />

f xx = 12x 2 , f xy = −4, f yy = 12y 2<br />

Per il punto P 0 abbiamo H f (P 0 ) = −16 < 0, quin<strong>di</strong> possiamo <strong>di</strong>re subito che P 0 è un punto<br />

<strong>di</strong> sella.<br />

Per P 1 si ha H f (P 1 ) = 128 > 0, f xx (P 1 ) = 12 > 0, quin<strong>di</strong> P 1 è un punto <strong>di</strong> minimo relativo<br />

interno proprio con valore minimo f(P 1 ) = 0.<br />

Per P 2 vale H f (P 2 ) = 128 > 0, f xx (P 2 ) = 12 > 0, quin<strong>di</strong> P 2 è un altro punto <strong>di</strong> minimo<br />

relativo interno proprio con valore minimo f(P 2 ) = 0.<br />

In Figura 4.1 possiamo osservare come P 1 e P 2 siano punti <strong>di</strong> minimo mentre P 0 è un<br />

punto <strong>di</strong> sella.<br />

42


4.4. Sui massimi e minimi assoluti<br />

Figura 4.2: Grafico della funzione f(x, y) = 2y 2 .<br />

Esempio<br />

Es. 4.3.2 Consideriamo ora la funzione f(x, y) = 2y 2 e cerchiamo i punti <strong>di</strong> massimo e<br />

minimo relativo. Per i punti critici, imponiamo che il gra<strong>di</strong>ente della funzione sia uguale<br />

a zero, quin<strong>di</strong><br />

{<br />

f x = 0<br />

f y = 4y = 0<br />

La f x vale sempre zero perchè la f non <strong>di</strong>pende da x, Dalla seconda equazione ricaviamo<br />

y = 0, da cui i punti critici della funzione sono tutti i punti <strong>di</strong> coor<strong>di</strong>nate (x, 0), cioè tutti i<br />

punti dell’asse delle x.<br />

An<strong>di</strong>amo a calcolare l’Hessiano in questi punti. Poichè f xx = 0, f xy = 0, e f yy = 4, segue<br />

che H f (x, 0) = 0. Quin<strong>di</strong> il teorema sul test delle derivate seconde non ci può <strong>di</strong>re nulla.<br />

In tal caso, dobbiamo vedere come è fatta la funzione e cercare <strong>di</strong> capire cosa succede in<br />

un intorno <strong>di</strong> questi punti critici.<br />

Fissato x = x 0 , per il punto (x 0 , 0), in un suo qualunque intorno vale f(x, y) = 2y 2 ≥ 0 =<br />

f(x 0 , 0) (posso prendere anche un punto che ha y = 0 ma x ≠ x 0 ). Si conclude quin<strong>di</strong><br />

che (x 0 , 0) è un punto <strong>di</strong> minimo relativo. Questo vale per tutti i punti (x, 0), che sono,<br />

dunque, tutti punti <strong>di</strong> minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare<br />

i risultati.<br />

4.4 Sui massimi e minimi assoluti<br />

Per funzioni scalari, il teorema <strong>di</strong> Weierstrass assicura che se una funzione è continua in<br />

un intervallo chiuso e limitato allora essa ammette massimo e minimo (assoluti).<br />

Lo stesso teorema vale anche per funzioni <strong>di</strong> più variabili.<br />

Teorema 4.4.1 (<strong>di</strong> Weierstrass) Data una funzione continua f : I −→ R, con I ⊂ R 2 , I<br />

insieme chiuso e limitato (quin<strong>di</strong> compatto), la f ammette massimo e minimo (assoluti) in I.<br />

43


4. MASSIMI E MINIMI<br />

Questo teorema è utile per trovare massimi e minimi assoluti <strong>di</strong> una funzione continua<br />

in un insieme compatto I. Si può applicare questo metodo:<br />

1. si calcola il valore della f nei punti critici della f che si trovano all’interno <strong>di</strong> I;<br />

2. si stu<strong>di</strong>a la funzione sulla frontiera <strong>di</strong> I e si cercano i valori estremi della f sulla<br />

frontiera;<br />

3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della<br />

funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della<br />

funzione. I corrispondenti punti sono rispettivamente i punti <strong>di</strong> massimo e minimo<br />

assoluti della funzione.<br />

Osserviamo, quin<strong>di</strong>, che la procedura per trovare i valori estremi assoluti <strong>di</strong> una funzione,<br />

in un insieme compatto, è <strong>di</strong>versa dalla procedura per trovare gli estremi relativi <strong>di</strong> una<br />

funzione me<strong>di</strong>ante il test delle derivate seconde.<br />

A volte, si cercano sia gli estremi assoluti sia gli estremi relativi <strong>di</strong> una funzione e, in<br />

questo caso, vanno seguite entrambe le strade.<br />

Esempio<br />

Es. 4.4.1 Si devono trovare gli estremi assoluti della funzione f(x, y) = x 2 − 4xy + 4y sul<br />

rettangolo D = {(x, y) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 4}.<br />

L’insieme D è un insieme chiuso e limitato (il rettangolo <strong>di</strong> vertici A(0, 0), B(2, 0), C(2, 4),<br />

D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema<br />

<strong>di</strong> Weierstrass, quin<strong>di</strong> esistono il massimo e il minimo assoluti della funzione in D.<br />

Cerchiamo i punti critici interni: da f x = 2x − 4y e f y = −4x + 4, ponendo queste derivate<br />

uguali a zero abbiamo il sistema <strong>di</strong> equazioni<br />

{<br />

2x − 4y = 0<br />

4 − 4x = 0<br />

Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = 1 2 . Otteniamo<br />

il punto critico P 0 (1, 1 2 ). Il punto P 0 si trova all’interno dell’insieme D (se così non fosse<br />

non lo dovremmo prendere in considerazione). Calcoliamo f(P 0 ) = 1. Non dobbiamo vedere<br />

se questo è un punto <strong>di</strong> massimo o minimo relativo (non è richiesto), quin<strong>di</strong> passiamo<br />

a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche<br />

gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La<br />

frontiera dell’insieme I è dato dall’unione dei segmenti AB, BC, CD e DA.<br />

Il segmento AB ha equazione y = 0 con 0 ≤ x ≤ 2. Su questo segmento la funzione f si<br />

riduce ad una funzione della sola variabile x, g(x) = f(x, 0) = x 2 , con 0 ≤ x ≤ 2. Si vede<br />

facilmente (poichè g ′ (x) = 2x ≥ 0 nell’intervallo dato) che la g è una funzione crescente<br />

in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2<br />

(g(2) = 4). Quin<strong>di</strong> dal segmento AB dobbiamo ricordare i punti A e B dove la funzione<br />

vale 0 e 4 rispettivamente.<br />

Il segmento BC ha equazione x = 2 con 0 ≤ y ≤ 4. Qui la funzione si riduce a h(y) =<br />

f(2, y) = 4−8y +4y = 4−4y nell’intervallo [0, 4]. La funzione è decrescente (h ′ (y) = −4 < 0),<br />

quin<strong>di</strong> assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = −12). Per y = 0<br />

ritroviamo il punto B, per y = 4 troviamo il vertice C.<br />

Sul segmento CD, <strong>di</strong> equazione y = 4, con 0 ≤ x ≤ 2, la funzione <strong>di</strong>venta g(x) = f(x, 4) =<br />

x 2 − 16x + 16 per x ∈ [0, 2]. La derivata g ′ (x) = 2x − 16 si annulla per x = 8 che è un punto<br />

all’esterno dell’intervallo in cui deve variare la x (se fosse all’interno avremmo trovato<br />

un punto critico da considerare ai fini del calcolo <strong>degli</strong> estremi della f). Si ha g ′ (x) < 0<br />

per 2x − 16 < 0 cioè x < 8: quin<strong>di</strong> nell’intervallo [0, 2] la g è decrescente e assume valore<br />

massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = −12). Per x = 0 abbiamo il vertice D,<br />

per x = 2 ritroviamo C.<br />

44


4.5. Funzioni implicite<br />

Figura 4.3: Grafico della funzione f(x, y) = x 2 − 4xy + 4y nell’insieme compatto [0, 2] × [0, 4].<br />

Arriviamo infine al segmento AD dato dall’equazione x = 0, per 0 ≤ y ≤ 4. La funzione<br />

<strong>di</strong>venta h(y) = f(0, y) = 4y. La funzione è crescente e assume valore minimo e massimo<br />

rispettivamente agli estremi 0 e 4. Ritroviamo i punti A e D.<br />

Quin<strong>di</strong> i valori da confrontare sono: P 1 (1, 1 2 ) dove f(P 1) = 1, A dove f(A) = 0, B con<br />

f(B) = 4, C dove f(C) = −12, e D con f(D) = 16.<br />

Dal confronto segue che il massimo assoluto vale 16 e punto <strong>di</strong> massimo assoluto è D,<br />

mentre il minimo assoluto è −12 con punto <strong>di</strong> minimo assoluto C.<br />

4.5 Funzioni implicite<br />

Nello stu<strong>di</strong>are funzioni scalari, abbiamo visto funzioni del tipo y = f(x): la variabile y è<br />

funzione esplicita della variabile y:<br />

y = sin (x), y = √ x 3 + 2, y = ln x + 4, . . . . . .<br />

Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y<br />

come, ad esempio,<br />

x 2 + y 2 = 9 o x 3 + y 3 = 12xy o xye xy2 + 3ye −x = 0 o . . .<br />

In alcuni casi è possibile risolvere questo tipo <strong>di</strong> equazioni scrivendo y come una funzione<br />

esplicita (o più funzioni esplicite) <strong>di</strong> x.<br />

Nel caso <strong>di</strong> x 2 + y 2 = 9, si ottiene y = ± √ √ 9 − x 2 , quin<strong>di</strong> due troviamo due funzioni f(x) =<br />

9 − x2 e g(x) = − √ 9 − x 2 . I grafici della f e della g sono rispettivamente il semicerchio<br />

superiore e inferiore della circonferenza x 2 + y 2 = 9 e, insieme, ci danno il grafico <strong>di</strong> tutta la<br />

circonferenza.<br />

Non è altrettanto facile trovare un’espressione esplicita <strong>di</strong> y come funzione <strong>di</strong> x nel caso<br />

<strong>di</strong> x 3 + y 3 = 12xy: potremmo usare la formula per trovare le ra<strong>di</strong>ci <strong>di</strong> un polinomio <strong>di</strong> terzo<br />

45


4. MASSIMI E MINIMI<br />

grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo<br />

neanche! Ci accontentiamo <strong>di</strong> sapere che è possibile risolvere il problema.<br />

Per la funzione xye xy2 + 3ye −x = 0 non riusciamo a trovare una formula esplicita che ci<br />

permetta <strong>di</strong> scrivere y in funzione <strong>di</strong> x o viceversa x come funzione <strong>di</strong> y.<br />

Si ha quin<strong>di</strong> questo problema: data un’equazione f(x, y) = 0 è possibile scrivere y = g(x)<br />

tale che f(x, g(x)) = 0 In tal caso <strong>di</strong>remo che la y = g(x) è definita implicitamente dalla f. Si<br />

ha la seguente definizione.<br />

Definizione 4.5.1 Data una funzione f(x, y) definita in un sottoinsieme <strong>di</strong> R 2 , <strong>di</strong>ciamo che<br />

la funzione y = g(x) definita in un intervallo <strong>di</strong> R è definita implicitamente dall’equazione<br />

f(x, y) = 0 se, per ogni x che appartiene all’intervallo <strong>di</strong> definizione della g, si ha che<br />

G il punto (x, g(x)) appartiene all’insieme <strong>di</strong> definizione della f;<br />

G f(x, g(x)) = 0.<br />

Dire f(x, y) = 0 vuol <strong>di</strong>re intersecare il grafico della superficie della funzione f con il piano<br />

z = 0, cioè con il piano xy, ricavandone quin<strong>di</strong> una curva. Per tutti quei punti per cui<br />

(x, g(x)) ∈ I e f(x, g(x)) = 0 il grafico della g coincide con il grafico della curva f(x, y) = 0.<br />

Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il<br />

seguente teorema.<br />

Teorema 4.5.1 (delle funzioni implicite o teorema <strong>di</strong> Dini) Sia data una funzione f :<br />

I −→ R con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) ≠ 0.<br />

Allora esiste un’unica funzione y = g(x) definita in un opportuno intorno <strong>di</strong> x 0 (]x 0 − ɛ, x 0 + ɛ[),<br />

<strong>di</strong> classe C 1 , tale che, per ogni x ∈]x 0 − ɛ, x 0 + ɛ[ risulta<br />

G y 0 = g(x 0 )<br />

G (x, g(x)) ∈ I<br />

G f(x, g(x)) = 0<br />

G g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x)) .<br />

La formula della derivata prima <strong>di</strong> g si ottiene applicando le regole <strong>di</strong> derivazione per le<br />

funzioni composte. Poichè f y (x 0 , y 0 ) ≠ 0, per il teorema della permanenza del segno si ha<br />

f y (x, g(x)) ≠ 0 in un intorno <strong>di</strong> (x 0 , y 0 ). Deriviamo ambo i membri dell’equazione f(x, g(x)) = 0<br />

rispetto alla variabile x (è come se avessimo x = t, y = g(x) = g(t) ma continuiamo a chiamare<br />

la variabile t con x). Abbiamo<br />

df<br />

dx = 0<br />

Ma (considerando che dx<br />

dx = 1)<br />

Dunque<br />

df<br />

dx = f x(x, g(x)) + f y (x, g(x))g ′ (x).<br />

f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />

Poichè, per l’ipotesi f y (x 0 , y 0 ) ≠ 0 (quin<strong>di</strong> anche f y (x, g(x)) ≠ 0) possiamo <strong>di</strong>videre tutto per f y<br />

ricavando<br />

g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x))<br />

Osserviamo che il teorema <strong>di</strong> Dini dà una con<strong>di</strong>zione sufficiente ma non necessaria per<br />

l’esistenza e unicità delle funzioni implicite.<br />

46


4.5. Funzioni implicite<br />

Come conseguenza del teorema, possiamo ricavare l’equazione della retta tangente alla<br />

funzione y = g(x) definita implicitamente dalla f nel punto x 0 . Infatti l’equazione della retta<br />

tangente in x 0 per la funzione g è data da<br />

y − g(x 0 ) = g ′ (x 0 )(x − x 0 ) cioè y − y 0 = − f x(x 0 , y 0 )<br />

f y (x 0 , y 0 ) (x − x 0)<br />

Moltiplicando ambo i membri per f y (x 0 , y 0 ) troviamo<br />

f y (x 0 , y 0 )(y − y 0 ) = −f x (x 0 , y 0 )(x − x 0 ) da cui f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

Quest’ultima relazione <strong>di</strong>ce che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta<br />

tangente alla curva f(x, y) = 0 in P 0 .<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta<br />

Facciamo un breve richiamo <strong>di</strong> geometria analitica per comprendere meglio che la<br />

relazione<br />

f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

scritta prima significa <strong>di</strong>re che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta tangente<br />

a f(x, y) = 0 in P 0 .<br />

Sia assegnata una retta nello spazio R 2 e sia P 0 = (x 0 , y 0 ) un punto che giace sulla retta.<br />

Sia ⃗n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpen<strong>di</strong>colare) alla<br />

retta: il vettore è detto vettore normale.<br />

Sia dato un altro generico punto P = (x, y) sulla retta.<br />

In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si veda<br />

figura 4.4). Il segmento P P 0 è dato dal vettore ⃗r − ⃗r 0 .<br />

Figura 4.4: retta nel piano<br />

Ora, poichè ⃗n è ortogonale alla retta, esso è ortogonale al vettore ⃗r − ⃗r 0 , cioè il prodotto<br />

scalare tra i due vettori è nullo:<br />

⃗n · (⃗r − ⃗r 0 ) = 0<br />

Poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 ), il prodotto scalare <strong>di</strong>venta<br />

a(x − x 0 ) + b(y − y 0 ) = 0<br />

47


4. MASSIMI E MINIMI<br />

Questa che abbiamo scritto rappresenta l’equazione della retta passante 2 per P e P 0 .<br />

Quin<strong>di</strong>, data l’equazione <strong>di</strong> una retta nella forma a(x − x 0 ) + b(y − y 0 ) = 0 il vettore che ha<br />

come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: ⃗n = (a, b).<br />

3<br />

Riprendendo la retta f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0, questa retta rappresenta la<br />

retta tangente a y = g(x) nel punto x 0 . Poichè il grafico della g coincide con il grafico della<br />

curva f(x, y) = 0 nell’intorno <strong>di</strong> x 0 , vuole <strong>di</strong>re che la retta è tangente alla curva f(x, g(x)) = 0<br />

in (x 0 , y 0 ). Il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è dunque ortogonale alla tangente a questa curva.<br />

Dallo stu<strong>di</strong>o <strong>di</strong> g ′ e, eventualmente <strong>di</strong> g ′′ (che si ottiene applicando nuovamente la formula<br />

<strong>di</strong> derivazione delle funzioni composte) possiamo ottenere informazioni sulla funzione g e,<br />

quin<strong>di</strong>, anche su f(x, y) = 0 nell’intorno <strong>di</strong> un punto (x 0 , y 0 ). Lo ve<strong>di</strong>amo con un esempio.<br />

Esempio<br />

Es. 4.5.1 Sia data la funzione f(x, y) = xe 4y + 3y − 1.<br />

Si vuol vedere se nel punto<br />

P 0 (x 0 , y 0 ) = (0, 1 ) sono verificate le ipotesi del teorema <strong>di</strong> Dini e, in caso affermativo,<br />

3<br />

se la funzione y = g(x) definita implicitamente da f(x, y) = 0 è una funzione crescente o<br />

decrescente, concava o convessa in un intorno <strong>di</strong> x 0 .<br />

Calcoliamo f(0, 1 3 ) = 0 + 1 − 1 = 0. Inoltre f y(x, y) = 4xe 4y + 3 e f y (0, 1 3 ) = 3 ≠ 0.<br />

L’altra derivata parziale è f x = e 4y . Le derivate parziali sono continue, quin<strong>di</strong> f ∈ C 1 .<br />

Siamo nelle ipotesi del teorema <strong>di</strong> Dini, quin<strong>di</strong> esiste un’unica funzione y = g(x) definita<br />

in un intorno <strong>di</strong> x 0 = 0 tale che (x, g(x)) appartiente all’insieme <strong>di</strong> definizione della f,<br />

f(x, g(x)) = 0 e g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x)) .<br />

Per vedere se la funzione è crescente o decrescente, calcoliamo g ′ (0). Poichè f x (0, 1 3 ) = e4/3<br />

e f y (0, 1 3 ) = 3, risulta g′ (0) = − e4/3<br />

< 0. Quin<strong>di</strong> la g è decrescente in un intorno <strong>di</strong> 0.<br />

3<br />

Per calcolare g ′′ (0) (e capire quin<strong>di</strong> se la g è convessa o concava) torniamo all’equazione<br />

f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />

e deriviamo ancora rispetto a x, ottenendo<br />

f xx (x, g(x))+f xy (x, g(x))g ′ (x)+f yx (x, g(x))g ′ (x)+f yy (x, g(x))(g ′ (x)) 2 +f y (x, g(x))g ′′ (x) = 0<br />

Nelle ipotesi (verificate in questo esempio) <strong>di</strong> derivate parziali seconde continue, vale<br />

f xy = f yx . Inoltre, f y (x, g(x)) ≠ 0 quin<strong>di</strong><br />

g ′′ (x) = − f xx(x, g(x)) + 2f xy (x, g(x))g ′ (x) + f yy (x, g(x))(g ′ (x)) 2<br />

f y (x, g(x))<br />

2 Spesso troviamo l’equazione scritta nella forma<br />

o ancora<br />

ax + by = d dove d = ax 0 + by 0<br />

y = mx + d dove m = − a b , d = a b x 0 + y 0<br />

3 ⃗n = (−m, 1), se usiamo la rappresentazione della retta me<strong>di</strong>ante y = mx + d.<br />

48


4.6. Curve <strong>di</strong> livello<br />

Adesso possiamo calcolare g ′′ (0). Abbiamo f xx = 0, f xy = 4e 4y , f yy = 16xe 4y , da cui<br />

f xx (P 0 ) = 0, f xy (P 0 ) = 4e 4/3 , f yy = 0, quin<strong>di</strong><br />

8e 4/3 (− e4/3<br />

g ′′ (0) = − 3 )<br />

> 0<br />

3<br />

La funzione è convessa in un intorno <strong>di</strong> 0.<br />

Osserviamo che, se f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) = 0, non possiamo applicare il teorema <strong>di</strong><br />

Dini. Tuttavia, se, oltre a f(x 0 , y 0 ) = 0, si ha f x (x 0 , y 0 ) ≠ 0, si può applicare il teorema <strong>di</strong> Dini,<br />

scambiando il ruolo <strong>di</strong> x e y. Si ha la seguente formulazione<br />

Teorema 4.5.2 (<strong>di</strong> Dini, scambiando il ruolo <strong>di</strong> x e y) Sia data una funzione f : I −→ R<br />

con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f x (x 0 , y 0 ) ≠ 0. Allora<br />

esiste un’unica funzione x = h(y) definita in un opportuno intorno <strong>di</strong> y 0 (]y 0 − ɛ, y 0 + ɛ[), <strong>di</strong> classe<br />

C 1 , tale che, per ogni y ∈]y 0 − ɛ, y 0 + ɛ[ risulta<br />

G x 0 = h(y 0 )<br />

G (h(y), y) ∈ I<br />

G f(h(y), y) = 0<br />

G h ′ (y) = − f y(h(y), y)<br />

f x (h(y), y) .<br />

Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare<br />

l’equazione della retta tangente o la sua derivata seconda.<br />

4.6 Curve <strong>di</strong> livello<br />

Un metodo per visualizzare una funzione <strong>di</strong> due variabili è quello usato per <strong>di</strong>segnare le<br />

mappe geografiche, dove i punti che hanno la stessa altezza sono uniti insieme in modo da<br />

formare le cosiddette curve <strong>di</strong> livello o linee isometriche (contour lines).<br />

Definizione 4.6.1 Si definiscono curve <strong>di</strong> livello <strong>di</strong> una funzione f <strong>di</strong> due variabili, tutte le<br />

curve <strong>di</strong> equazioni f(x, y) = c con c costante che appartiene all’insieme dei valori della f.<br />

La curva <strong>di</strong> livello f(x, y) = c è quin<strong>di</strong> l’insieme <strong>di</strong> tutti i punti del dominio della f in cui la<br />

funzione assume il valore assegnato c. Mostra, quin<strong>di</strong>, dove il grafico della f ha altezza c.<br />

In Figura 4.5 troviamo un esempio <strong>di</strong> applicazione delle curve <strong>di</strong> livello per rappresentare<br />

la temperatura in Europa. Ciascuna curva rappresenta un valore <strong>di</strong>verso <strong>di</strong> temperatura.<br />

Per funzioni matematiche, un esempio <strong>di</strong> curve <strong>di</strong> livello si vede in Figura 4.6 dove, a sinistra,<br />

vi è la superficie data da z = √ x 2 + y 2 mentre, a destra, sono rappresentate le sue curve <strong>di</strong><br />

livello.<br />

Proposizione 4.6.1 Dato un valore c e P 0 = (x 0 , y 0 ) tale che f(x 0 , y 0 ) = c nell’ipotesi che P 0<br />

non sia critico per la f, allora il gra<strong>di</strong>ente ⃗ ∇(f)(P 0 ) è ortogonale alla curva <strong>di</strong> livello f(x, y) = c<br />

in P 0 .<br />

Dimostrazione. Per la <strong>di</strong>mostrazione, ci riconduciamo al teorema <strong>di</strong> Dini delle funzioni<br />

implicite, considerando F (x, y) = f(x, y) − c.<br />

Per ipotesi P 0 non è punto critico, quin<strong>di</strong> almeno una delle due derivate parziali è non<br />

nulla in P 0 . Consideriamo il caso in cui f y (x 0 , y 0 ) ≠ 0.<br />

Allora F (x 0 , y 0 ) = 0, mentre F y (x, y) = f y (x, y) da cui F y (x 0 , y 0 ) = f y (x 0 , y 0 )<br />

49


4. MASSIMI E MINIMI<br />

Figura 4.5: Curve <strong>di</strong> livello nelle mappe <strong>di</strong> meteorologia.<br />

Figura 4.6: Superficie f(x, y) = √ x 2 + y 2 (a sinistra) e le sue curve <strong>di</strong> livello (a destra).<br />

Essendo sod<strong>di</strong>sfatte le ipotesi del teorema <strong>di</strong> Dini, esiste un’unica funzione definita implicitamente<br />

dalla F , y = g(x). Allora l’equazione della retta tangente alla F in P 0 ha<br />

equazione<br />

F x (x 0 , y 0 )(x − x 0 ) + F y (x 0 , y 0 )(y − y 0 ) = 0<br />

Con lo stesso ragionamento fatto prima F x (x, y) = f x (x, y) da cui ricaviamo<br />

f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

Quin<strong>di</strong> il vettore ⃗ ∇f(P 0 ) è un vettore perpen<strong>di</strong>colare (normale) alla retta tangente alla<br />

curva f(x, y) = c nel punto P 0 . ✔<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente<br />

Consideriamo una funzione f <strong>di</strong>fferenziabile. Da quanto abbiamo appena visto, il vettore<br />

gra<strong>di</strong>ente nel punto P 0 (x 0 , y 0 ), ⃗ ∇f(P 0 ), è perpen<strong>di</strong>colare alla retta tangente alla curva f(x, y) =<br />

50


4.6. Curve <strong>di</strong> livello<br />

Figura 4.7: Sul prodotto scalare.<br />

c che passa per P 0 . Più brevemente, possiamo <strong>di</strong>re che è perpen<strong>di</strong>colare alla curva <strong>di</strong> livello.<br />

Il vettore gra<strong>di</strong>ente fornisce anche informazioni sulla <strong>di</strong>rezione <strong>di</strong> massima crescita della<br />

funzione f. Infatti, dal momento che la derivata <strong>di</strong>rezionale <strong>di</strong>ce la velocità <strong>di</strong> cambiamento<br />

della f in quella <strong>di</strong>rezione, noi possiamo calcolare la derivata <strong>di</strong>rezionale della f in P 0 lungo<br />

tutte le possibili <strong>di</strong>rezioni e vedere qual è il valore massimo e per quale <strong>di</strong>rezione si ottiene.<br />

Per la formula del gra<strong>di</strong>ente, si ha (considerando ⃗v vettore unitario)<br />

∂f(P 0 )<br />

∂⃗v<br />

= ⃗ ∇f(P 0 ) · ⃗v = | ⃗ ∇f(P 0 )||⃗v| cos θ = | ⃗ ∇f(P 0 )| cos θ<br />

dove θ è l’angolo in<strong>di</strong>viduato dai vettori ∇f(P ⃗ 0 ) e ⃗v. Osserviamo che il prodotto scalare<br />

scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando<br />

le componenti dei vettori. 4 Poichè il massimo valore <strong>di</strong> cos θ è 1 e questo si ha quando θ = 0,<br />

vuol <strong>di</strong>re che il valore massimo della derivata <strong>di</strong>rezionale ∂f(P 0)<br />

vale | ∇f(P<br />

∂⃗v<br />

⃗ 0 )| e si ha quando<br />

θ = 0 cioè quando ⃗v ha la stessa <strong>di</strong>rezione <strong>di</strong> ∇f(P ⃗ 0 ).<br />

4 Proviamo che, dati due vettori ⃗a = (a 1 , a 2 ) e ⃗ b = (b 1 , b 2 ), il prodotto scalare ⃗a · ⃗b = a 1 b 1 + a 2 b 2 si può scrivere,<br />

in modo del tutto equivalente come ⃗a ·⃗b = |⃗a|| ⃗ b| cos θ con θ l’angolo in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b.<br />

A tal proposito ricor<strong>di</strong>amo il teorema <strong>di</strong> Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati<br />

(che scriviamo come vettori) ⃗a e ⃗ b che formano un angolo θ, per il terzo lato ⃗c vale<br />

|⃗c| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos θ<br />

dove |⃗a|, | ⃗ b|, |⃗c| sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo).<br />

Se consideriamo il vettore ⃗a + ⃗ b, applicando sia la regola del parallelogramma sia il teorema <strong>di</strong> Carnot, tenendo<br />

conto che adesso l’angolo compreso tra i due lati è π − θ (si veda Figura 4.7) e che cos (π − θ) = − cos θ, si ha<br />

|⃗a + ⃗ b| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos (π − θ) = |⃗a| 2 + | ⃗ b| 2 + 2|⃗a|| ⃗ b| cos θ<br />

Da questa relazione ricaviamo<br />

|⃗a|| ⃗ b| cos θ = 1 “|⃗a + ⃗ b| 2 − |⃗a| 2 − | ⃗ b| 2”<br />

2<br />

Scrivendo in modo esplicito i moduli dei vettori, |⃗a+ ⃗ b| 2 = (a 1 +b 1 ) 2 +(a 2 +b 2 ) 2 , |⃗a| 2 = (a 1 ) 2 +(a 2 ) 2 e | ⃗ b| 2 = (b 1 ) 2 +(b 2 ) 2 ,<br />

e sostituendo, si ha proprio<br />

|⃗a|| ⃗ b| cos θ = a 1 b 1 + a 2 b 2<br />

Quin<strong>di</strong> il prodotto scalare può essere scritto sia in un modo che nell’altro.<br />

51


4. MASSIMI E MINIMI<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

In molti problemi che <strong>di</strong>scendono da applicazioni pratiche, si cerca il massimo o il minimo<br />

<strong>di</strong> una funzione soggetta ad una particolare con<strong>di</strong>zione che viene chiamata vincolo. Si <strong>di</strong>ce,<br />

allora, che si cercano gli estremi vincolati.<br />

Esempio<br />

Es. 4.7.1 Si deve costruire una scatola <strong>di</strong> cartone, priva <strong>di</strong> coperchio, utilizzando 12m 2<br />

(metri quadrati) <strong>di</strong> cartone. Si vuole costruire una scatola con il massimo volume<br />

possibile.<br />

Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza,<br />

larghezza e altezza della scatola).<br />

La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai<br />

12m 2 <strong>di</strong> cartone a <strong>di</strong>sposizione).<br />

La superficie rappresenta il vincolo per la funzione volume <strong>di</strong> cui vogliamo calcolare il<br />

massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in<br />

funzione <strong>di</strong> x e y dalla relazione 2xz + 2yz + xy = 12:<br />

z =<br />

12 − xy<br />

2(x + y)<br />

La funzione V <strong>di</strong>venta una funzione <strong>di</strong> due variabili<br />

12 − xy<br />

V = xyz = xy<br />

2(x + y) = 12xy − x2 y 2<br />

2(x + y)<br />

Cerchiamo, <strong>di</strong> questa funzione, gli estremi relativi e tra questi ve<strong>di</strong>amo se c’è una soluzione<br />

fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere<br />

positive).<br />

Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui<br />

z = 1.<br />

Tuttavia, questa strada non è sempre percorribile. Perciò ve<strong>di</strong>amo cosa si deve fare, in<br />

generale, quando si cercano punti <strong>di</strong> massimo o minimo <strong>di</strong> una funzione soggetta a un<br />

vincolo.<br />

Ve<strong>di</strong>amo il caso in cui dobbiamo cercare i valori estremi <strong>di</strong> una funzione f(x, y) soggetta<br />

al vincolo espresso dall’equazione g(x, y) = c. In maniera del tutto equivalente, possiamo <strong>di</strong>re<br />

che dobbiamo cercare i valori estremi della f(x, y) quando il punto (x, y) deve appartenere<br />

alla curva <strong>di</strong> livello g(x, y) = c. In Figura 4.8 ve<strong>di</strong>amo la curva g(x, y) = c e delle curve <strong>di</strong> livello<br />

della funzione f(x, y). Queste curve <strong>di</strong> livello hanno equazione f(x, y) = k con k = 7, 8, 9, 10, 11.<br />

Se vogliamo cercare il massimo della f(x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il<br />

più grande valore <strong>di</strong> k tale che la curva <strong>di</strong> livello f(x, y) = k interseca g(x, y) = c. Dalla Figura,<br />

si può vedere che questo accade quando le due curve si toccano appena l’una con l’altra,<br />

cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette<br />

tangenti sia a g(x, y) = c sia a f(x, y) = k, nel punto (x 0 , y 0 ), che è il punto in cui g(x, y) = c<br />

e f(x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta<br />

tangente ad una funzione f(x, y) è il gra<strong>di</strong>ente della f, vuol <strong>di</strong>re che ∇f(x ⃗ 0 , y 0 ) e ∇g(x ⃗ 0 , y 0 )<br />

sono vettori paralleli, cioè le loro componenti <strong>di</strong>fferiscono <strong>di</strong> una costante. Seguiremo questo<br />

approccio per il metodo dei moltiplicatori <strong>di</strong> Lagrange.<br />

Teorema 4.7.1 Data una funzione f ∈ C 1 (I), con I ⊂ R 2 aperto, con<strong>di</strong>zione necessaria affinchè<br />

P 0 (x 0 , y 0 ) ∈ I sia un punto <strong>di</strong> massimo o minimo relativo della f soggetta al vincolo<br />

g(x, y) = c è che<br />

G g(x 0 , y 0 ) = c<br />

52


4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

Figura 4.8: Sul prodotto scalare.<br />

G la matrice<br />

(<br />

fx (P 0 )<br />

)<br />

f y (P 0 )<br />

g x (P 0 ) g y (P 0 )<br />

abbia determinante nullo: f x (P 0 )g y (P 0 ) − g x (P 0 )f y (P 0 ) = 0<br />

Proposizione 4.7.1 Se P 0 (x 0 , y 0 ) è un estremo vincolato della funzione f soggetta al vincolo<br />

g(x, y) = c e se P 0 è punto interno all’insieme <strong>di</strong> definizione della f e non è punto critico nè per<br />

la f nè per la g, allora g(x, y) = c e f(x, y) = f(x 0 , y 0 ) hanno in P 0 la stessa retta tangente.<br />

Dimostrazione. Se scriviamo le equazioni delle rette tangenti a f(x, y) = f(x 0 , y 0 ) e<br />

alla curva g(x, y) = c nel punto P 0 , abbiamo f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) = 0 e g x (P 0 )(x −<br />

x 0 ) + g y (P 0 )(y − y 0 ) = 0. Poichè P 0 è un estemo vincolato, vale la con<strong>di</strong>zione f x (P 0 )g y (P 0 ) −<br />

g x (P 0 )f y (P 0 ) = 0, ma questa relazione rappresenta una con<strong>di</strong>zione <strong>di</strong> parallelismo tra le due<br />

rette tangenti. 5 ✔<br />

Il vincolo si può anche rappresentare come una funzione Φ(x, y) = 0 (caso particolare:<br />

Φ(x, y) = g(x, y) − c). Il teorema si riscrive in maniera del tutto analoga.<br />

La matrice<br />

( )<br />

fx (P 0 ) f y (P 0 )<br />

g x (P 0 ) g y (P 0 )<br />

prende il nome <strong>di</strong> matrice jacobiana della f e della g. Vale infatti la seguente definizione.<br />

Definizione 4.7.1 Date le due funzioni f 1 (x, y) e f 2 (x, y) si definisce matrice jacobiana, la<br />

matrice<br />

⎛ ⎞<br />

∂f 1 ∂f 1<br />

∂(f 1 , f 2 ) ⎜<br />

=<br />

∂x ∂y ⎟<br />

⎝ ⎠<br />

∂(x, y)<br />

∂f 2<br />

∂x<br />

∂f 2<br />

∂y<br />

Si definisce jacobiano, il determinante della matrice jacobiana.<br />

Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una<br />

con<strong>di</strong>zione necessaria ma non sufficiente.<br />

5 Ricor<strong>di</strong>amo che, date due rette ax + by + c = 0 e a ′ x + b ′ y + c ′ = 0 la con<strong>di</strong>zione <strong>di</strong> parallelismo è a a ′ = b b ′ ovvero<br />

ab ′ − a ′ b = 0.<br />

53


4. MASSIMI E MINIMI<br />

Figura 4.9: Curve <strong>di</strong> livello della funzione f(x, y) = x 2 + 4y 2 e il vincolo x 2 + y 2 = 1.<br />

Il metodo dei moltiplicatori <strong>di</strong> Lagrange ci permette <strong>di</strong> trovare gli estremi <strong>di</strong> una funzione<br />

f(x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per<br />

applicare questo metodo deve essere ∇Φ(x, ⃗ y) ≠ 0.<br />

Abbiamo detto che, se P 0 è un punto <strong>di</strong> estremo vincolato, il gra<strong>di</strong>ente della f e della<br />

funzione <strong>di</strong> vincolo sono tra loro paralleli, cioè le componenti dei due vettori gra<strong>di</strong>ente<br />

<strong>di</strong>fferiscono per una costante. Introduciamo questa costante me<strong>di</strong>ante la variabile λ detta<br />

moltiplicatore <strong>di</strong> Lagrange: vuol <strong>di</strong>re che f x (x 0 , y 0 ) = λΦ x (x 0 , y 0 ) e f y (x 0 , y 0 ) = λΦ y (x 0 , y 0 ).<br />

Ora, per capire chi possa essere (x 0 , y 0 ), definiamo la funzione H(x, y, λ) = f(x, y)+λΦ(x, y),<br />

che <strong>di</strong>pende dalle variabili x, y e λ. Il metodo dei moltiplicatori <strong>di</strong> Lagrange consiste dei<br />

seguenti passi:<br />

1. risolviamo il sistema <strong>di</strong> equazioni dato da<br />

⃗∇H(x, y, λ) = 0<br />

vale a <strong>di</strong>re:<br />

⎧<br />

⎪⎨ f x (x, y) + λΦ x (x, y) = 0<br />

f y (x, y) + λΦ y (x, y) = 0<br />

⎪⎩<br />

Φ(x, y) = 0<br />

(a meno del segno ritroviamo la con<strong>di</strong>zione <strong>di</strong> parallelismo detta prima);<br />

2. valutiamo la funzione f nella/e soluzione/i trovate e identifichiamo i valori <strong>di</strong> massimo<br />

e minimo, (se esistono).<br />

Esempio<br />

Es. 4.7.2 Si devono cercare i valori estremi della funzione f(x, y) = x 2 + 4y 2 sul cerchio<br />

x 2 + y 2 = 1.<br />

In questo caso il vincolo è dato dall’equazione della circonferenza. Applichiamo il metodo<br />

dei moltiplicatori <strong>di</strong> Lagrange, introducendo la funzione H(x, y, λ) = x 2 +4y 2 +λ(x 2 +y 2 −1)<br />

54


4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

Il sistema da risolvere è<br />

⎧<br />

⎪⎨ 2x + 2λx = 0<br />

8y + 2λy = 0<br />

⎪⎩<br />

x 2 + y 2 = 1<br />

Dalla prima equazione ricaviamo x = 0 e λ = −1 mentre dalla seconda otteniano y = 0<br />

e λ = −4. Sostituendo x = 0 nella terza equazione (il vincolo) abbiamo y 2 = 1 da cui y =<br />

±1. Sostituendo y = 0 nel vincolo ricaviamo x = ±1. Il valore <strong>di</strong> λ non ci interessa perchè<br />

abbiamo trovato tutti i punti (x, y) che verificano il sistema <strong>di</strong> equazioni. Abbiamo<br />

P 0 (0, 1), P 1 (0, −1), P 2 (1, 0) e P 3 (−1, 0). Calcoliamo la f in questi punti: f(P 0 ) = f(P 1 ) = 4,<br />

f(P 2 ) = f(P 3 ) = 1. Il valore massimo sul vincolo è dato da 4, nei punti P 0 e P 1 . Il<br />

valore minimo sul vincolo è dato da 1 nei punti P 2 e P 3 . Controllando la Figura 4.9<br />

dove ci sono le curve <strong>di</strong> livello della f e la circonferenza, si può vedere come i valori<br />

trovati applicando il metodo dei moltiplicatori <strong>di</strong> Lagrange siano effettivamente quelli<br />

che corrispondono a punti <strong>di</strong> massimo e minimo della f sul vincolo, in quanto le rette<br />

tangenti alla curva <strong>di</strong> livello e alla circonferenza, nei punti trovati, coincidono.<br />

55


CAPITOLO 5<br />

Le curve<br />

A quelli che non conoscono la<br />

matematica è <strong>di</strong>fficile<br />

percepire, come una<br />

sensazione reale, la bellezza, la<br />

profonda bellezza della Natura.<br />

Se volete conoscere la Natura,<br />

apprezzarla, è necessario<br />

comprendere il linguaggio che<br />

essa parla.<br />

Richard Phillips Feynman<br />

(1919-1988)<br />

5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

5.1 Equazioni parametriche <strong>di</strong> una curva<br />

Supponiamo che una particella si muova lungo una curva γ come quella mostrata in Figura<br />

5.1. Non riusciamo a descrivere la curva me<strong>di</strong>ante un’equazione della forma y = f(x)<br />

(cioè attraverso il grafico <strong>di</strong> una funzione) perchè ci sono <strong>di</strong>verse rette verticali che intersecano<br />

la curva più <strong>di</strong> una volta (mentre per una funzione del tipo y = f(x), ad ogni valore <strong>di</strong><br />

57


5. LE CURVE<br />

Figura 5.1: Una particella che si muove su una curva γ.<br />

x deve corrispondere un solo valore f(x)). Tuttavia, possiamo pensare alle coor<strong>di</strong>nate (x, y)<br />

della particella che si muove lungo la curva come funzioni del tempo t in modo da poter<br />

scrivere x = f(t) e y = g(t). Questa coppia <strong>di</strong> funzioni ci permette <strong>di</strong> descrivere la curva e <strong>di</strong><br />

dare la definizione <strong>di</strong> curva sotto forma <strong>di</strong> equazioni parametriche.<br />

Definizione 5.1.1 Se x e y sono entrambe funzioni <strong>di</strong> una terza variabile t (t è detto<br />

parametro), le equazioni<br />

x = f(t),<br />

y = g(t)<br />

sono dette equazioni parametriche.<br />

Ogni valore <strong>di</strong> t determina un punto (x, y): al variare <strong>di</strong> t varia il punto (x, y) che, sul piano<br />

cartesiano, descrive una curva γ, che chiamiamo curva parametrica.<br />

Il parametro t non rappresenta necessariamente il tempo e quin<strong>di</strong> si può anche utilizzare<br />

un’altra lettera per rappresentare il parametro. Poichè, in molte applicazioni, t denota il<br />

tempo, ci è più facile vedere (x, y) = (f(t), g(t)) come la posizione della particella al tempo t.<br />

Esempio<br />

Es. 5.1.1 Proviamo a fare il grafico per capire quale curva è rappresentata me<strong>di</strong>ante le<br />

equazioni parametriche<br />

{<br />

x = t 2 + t<br />

y = 2t − 1<br />

Ciascun valore <strong>di</strong> t dà un punto della curva. Perciò consideriamo <strong>di</strong>versi valori <strong>di</strong> t e i<br />

corrispondenti punti che si ottengono:<br />

t x y<br />

-2 2 -5<br />

-1 0 -3<br />

-1/2 -1/4 -2<br />

0 0 -1<br />

1 2 1<br />

In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per<br />

molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico <strong>di</strong> una curva.<br />

58


5.1. Equazioni parametriche <strong>di</strong> una curva<br />

Figura 5.2: Curva data da x = t 2 + t, y = 2t − 1<br />

Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche<br />

x = f(t), y = g(t), si muove lungo la curva nella <strong>di</strong>rezione <strong>di</strong> t crescente. Ciò significa che<br />

una curva parametrica ha una <strong>di</strong>rezione, un orientamento dato da valori crescenti<br />

<strong>di</strong> t. Sul grafico la <strong>di</strong>rezione del movimento della curva è in<strong>di</strong>cata me<strong>di</strong>ante freccette.<br />

Inoltre, osserviamo che a valori <strong>di</strong> t equi<strong>di</strong>stanti non corrispondono, sulla curva, punti<br />

equi<strong>di</strong>stanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al<br />

variare <strong>di</strong> t.<br />

Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola.<br />

In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio<br />

l’equazione <strong>di</strong> una parabola. Per far ciò, dalla seconda equazione y = 2t − 1 ricaviamo<br />

t = 1 (y + 1) e sostituiamo il valore trovato per t nell’equazione in x. Troviamo<br />

2<br />

( ) 2 1<br />

x =<br />

2 (y + 1) + 1 2 (y + 1) = 1 4 y2 + y + 3 4<br />

Riconosciamo l’equazione <strong>di</strong> una parabola.<br />

Nell’esempio, t può variare in tutto R. Se invece t deve variare in un intervallo finito,<br />

allora anche la curva risente <strong>degli</strong> effetti del parametro.<br />

Esempio<br />

Es. 5.1.2 Consideriamo le equazioni parametriche della curva precedente, ma con t ∈<br />

[−1, 1]:<br />

x = t 2 + t y = 2t − 1 − 1 ≤ t ≤ 1<br />

Abbiamo solo una porzione della curva che abbiamo <strong>di</strong>segnata prima (si veda Figura 5.3).<br />

59


5. LE CURVE<br />

Figura 5.3: Curva data da x = t 2 + t, y = 2t − 1, con −1<br />

Definizione 5.1.2 La curva <strong>di</strong> equazioni parametriche<br />

x = f(t), y = g(t), t 0 ≤ t ≤ t f<br />

ha punto iniziale (f(t 0 , g(t 0 )) e punto finale (f(t f ), g(t f )).<br />

Esempio<br />

Es. 5.1.3 Cerchiamo <strong>di</strong> capire qual è la curva rappresentata dalle equazioni<br />

parametriche x = cos t, y = sin t, con 0 ≤ t ≤ 2π.<br />

Se facciamo un grafico con le coppie <strong>di</strong> punti (x, y) al variare <strong>di</strong> t, otteniamo il grafico<br />

<strong>di</strong> una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta<br />

sfruttiamo le relazioni trigonometriche osservando che<br />

x 2 + y 2 = cos 2 t + sin 2 t = 1<br />

Quin<strong>di</strong> la circonferenza ha centro nell’origine e raggio 1.<br />

In questo esempio il parametro t può essere interpretato come l’angolo in ra<strong>di</strong>anti. Al<br />

variare <strong>di</strong> t in [0, 2π], il punto (x, y) = (cos t, sin t) si muove sulla circonferenza in <strong>di</strong>rezione<br />

antioraria partendo dal punto (1, 0) e ritornando allo stesso punto.<br />

Esempio<br />

Es. 5.1.4 Ve<strong>di</strong>amo ora la curva rappresentata dalle equazioni parametriche x = sin 4t ,<br />

y = cos 4t, con 0 ≤ t ≤ 2π.<br />

Di nuovo, da x 2 + y 2 = sin 2 4t + cos 2 4t = 1 ritroviamo l’equazione della circonferenza <strong>di</strong><br />

centro l’origine e raggio 1.<br />

Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori <strong>di</strong> t<br />

crescenti, la particella si muove in <strong>di</strong>rezione oraria lungo la circonferenza e la percorre 4<br />

volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π.<br />

60


5.2. Grafico <strong>di</strong> una curva parametrica<br />

Quin<strong>di</strong> la stessa curva può essere rappresentata in mo<strong>di</strong> <strong>di</strong>versi. Conviene perciò fare la<br />

<strong>di</strong>stinzione tra curva, come insieme <strong>di</strong> punti, da curva parametrica, come insieme <strong>di</strong> punti<br />

tracciati in modo particolare.<br />

5.2 Grafico <strong>di</strong> una curva parametrica<br />

Per fare il grafico <strong>di</strong> un’equazione della forma x = g(y) possiamo usare le equazioni<br />

parametriche<br />

x = g(t), y = t.<br />

Alla stessa maniera le curve <strong>di</strong> equazioni y = f(x) (le familiari funzioni <strong>di</strong> una variabile reale),<br />

possono essere viste come curve <strong>di</strong> equazioni parametriche<br />

x = t,<br />

y = f(t).<br />

In generale, data una curva parametrica <strong>di</strong> equazioni x = f(t), y = g(t), con t 0 ≤ t ≤ t f , per<br />

farne il grafico possiamo far variare t nell’intervallo assegnato (o per valori crescenti in R) e<br />

vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere<br />

l’orientamento della curva.<br />

A volte conviene eliminare il parametro t per capire <strong>di</strong> che curva si tratta.<br />

Altre volte la curva è talmente complicata che conviene affidarsi a programmi <strong>di</strong> grafica<br />

al calcolatore per poterla visualizzare.<br />

Esempio<br />

Es. 5.2.1 Consideriamo il caso <strong>di</strong> una curva data da<br />

x = a cos (αt) y = b cos (αt) 0 ≤ t ≤ 2π<br />

dove a, b, α sono delle costanti.<br />

Visto che le funzioni sono trigonometriche, conviene sfruttare relazioni della trigonometria<br />

per capire <strong>di</strong> che curva si tratta.<br />

Facciamo un cambio <strong>di</strong> variabile ponendo u = αt. Allora le equazioni <strong>di</strong>ventano<br />

x = a cos u y = b sin u 0 ≤ u ≤ 2απ<br />

Possiamo scrivere<br />

1 = cos 2 u + sin 2 u = x2<br />

a 2 + y2<br />

b 2<br />

trovando l’equazione <strong>di</strong> un’ellisse avente come centro l’origine (se a > b l’ellisse è orizzontale<br />

con l’asse maggiore sull’asse delle x, viceversa se a < b l’ellisse è verticale con<br />

l’asse maggiore sull’asse delle y, se invece a = b l’ellisse si riduce ad una circonferenza<br />

<strong>di</strong> raggio a).<br />

L’ellisse, per u ∈ [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol <strong>di</strong>re<br />

che la curva viene percorsa α volte dal parametro u: è come un circuito <strong>di</strong> formula 1 da<br />

ripetere per un numero α <strong>di</strong> giri.<br />

61


5. LE CURVE<br />

Figura 5.4: curva x = 4 cos (3t)<br />

y = 1 + cos 2 (3t)<br />

Esempio<br />

Es. 5.2.2 Il cammino <strong>di</strong> una particella è dato da<br />

x = 4 cos (3t)<br />

y = 1 + cos 2 (3t)<br />

Proviamo a descrivere questo cammino cercando <strong>di</strong> capire dove variano x e y e in<strong>di</strong>viduando<br />

l’intervallo in cui varia t per percorrere la curva solo una volta (nel caso in cui<br />

possa percorrerla più <strong>di</strong> una volta).<br />

Per eliminare il parametro t, sfruttiamo il fatto che le due equazioni parametriche hanno<br />

solo coseni, ricavando cos (3t) dalla prima equazione e sostituendo nella seconda:<br />

cos (3t) = x 4<br />

( x<br />

) 2 x 2<br />

y = 1 + = 1 +<br />

4 16<br />

Ricaviamo una parabola. Inoltre<br />

−1 ≤ cos (3t) ≤ 1 =⇒ −4 ≤ 4 cos (3t) ≤ 4 =⇒ −4 ≤ x ≤ 4<br />

0 ≤ cos 2 (3t) ≤ 1 =⇒ 1 ≤ 1 + cos 2 (3t) ≤ 2 =⇒ 1 ≤ y ≤ 2<br />

Proviamo ora per alcuni valori <strong>di</strong> t cosa si ricava per x e y:<br />

t x y<br />

0 4 2<br />

π/2 0 1<br />

π -4 2<br />

3π/2 0 1<br />

2π 4 2<br />

L’arco <strong>di</strong> parabola viene ripetuto più volte come un pendolo.<br />

Dagli esempi visti possiamo osservare che ci sono curve i cui punti (x, y) sono dati da un<br />

62


5.3. Parametrizzare una curva<br />

solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per <strong>di</strong>versi valori <strong>di</strong> t.<br />

Abbiamo le seguenti definizioni<br />

Definizione 5.2.1 Data una curva <strong>di</strong> equazioni parametriche x = f(t), y = g(t),<br />

G se un punto (x, y) si ottiene me<strong>di</strong>ante un solo valore del parametro t, allora il punto è detto<br />

semplice;<br />

G se un punto (x, y) si ottiene me<strong>di</strong>ante più valori del parametro t, allora il punto è detto<br />

multiplo.<br />

Definizione 5.2.2 Una curva è chiusa se è definita per t ∈ [t 0 , t f ] e (x(t 0 ), y(t 0 )) = (x(t f ), y(t f )):<br />

il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla<br />

curva che si ha per il valore finale <strong>di</strong> t.<br />

5.3 Parametrizzare una curva<br />

A volte, data una curva come equazione in x e y, vogliamo parametrizzarla.<br />

Il caso più interessante è quello <strong>di</strong> un’ellisse (e quin<strong>di</strong>, come caso particolare, un cerchio):<br />

x 2<br />

a 2 + y2<br />

b 2 = 1<br />

Come equazioni parametriche, possiamo considerare<br />

x = a cos (t) y = b sin (t) 0 ≤ t ≤ 2π<br />

In tal caso l’ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l’ellisse in senso<br />

antiorario.<br />

Una curva può essere parametrizzata in vari mo<strong>di</strong>, comunque. L’ellisse precedente, ad<br />

esempio, può essere parametrizzata come<br />

x = a cos (αt)<br />

x = a sin (αt)<br />

x = a cos (αt)<br />

y = b sin (αt)<br />

y = b cos (αt)<br />

y = −b sin (αt)<br />

La presenza della costante α ci <strong>di</strong>ce quante volte viene percorsa l’ellisse. Le ultime due<br />

equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da<br />

t = 0).<br />

5.4 Tangente ad una curva<br />

Assegnate le equazioni parametriche <strong>di</strong> una curva<br />

x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />

vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo<br />

punto.<br />

Nel caso <strong>di</strong> una funzione y = F (x), la retta tangente a F per x = a è data dall’equazione<br />

p(x) = m(x − a) + F (a), dove m = F ′ (a) = dy<br />

dx | x=a<br />

Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione <strong>di</strong> x,<br />

possiamo utilizzare la formula appena scritta per ricavare l’equazione della tangente alla<br />

63


5. LE CURVE<br />

curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro<br />

t e non <strong>di</strong> x.<br />

Supponiamo <strong>di</strong> avere (ma non abbiamo) una funzione y = F (x) che ci permetta <strong>di</strong> scrivere<br />

la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo<br />

che y = y(t) e x = x(t), quin<strong>di</strong> sostituendo abbiamo<br />

y(t) = y = F (x) = F (x(t)) =⇒ y(t) = F (x(t))<br />

Deriviamo rispetto a t:<br />

dy<br />

dt<br />

dF (x(t)) dx<br />

=<br />

dx dt<br />

A noi serve una formula per dy<br />

dF (x)<br />

ovvero per per avere la retta tangente. Dalla relazione<br />

dx dx<br />

precedente, nell’ipotesi in cui dx<br />

dt ≠ 0 ricaviamo<br />

dy dF (x(t))<br />

= =<br />

dx dx<br />

dy<br />

dt<br />

dx<br />

dt<br />

Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta<br />

come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta<br />

scambiare il ruolo della x con la y. L’equazione della retta tangente nel punto f(a) è del tipo<br />

p(y) = m(y − f(a)) + H ′ (f(a))<br />

con m = H ′ (f(a)) = dx<br />

dy | y=f(a). In maniera del tutto analoga a quanto visto prima, si ricava<br />

dx<br />

dx<br />

dy = dt<br />

dy<br />

dt<br />

per dy<br />

dt ≠ 0<br />

Esempio<br />

Es. 5.4.1 Troviamo la tangente alla curva parametrica data dalle equazioni<br />

x = t 5 − 4t 3 y = t 2<br />

nel punto (0, 4).<br />

Vedremo, in questo caso, che troveremo più <strong>di</strong> una retta tangente al punto assegnato (e<br />

ne capiremo presto il motivo).<br />

Per prima cosa applichiamo la formula data prima:<br />

dy<br />

dy<br />

dx = dt<br />

dx<br />

dt<br />

=<br />

2t<br />

5t 4 − 12t 2 = 2<br />

5t 3 − 12t<br />

64


5.4. Tangente ad una curva<br />

Figura 5.5: rette tangenti al punto (0.4) della curva x = t 5 − 4t 3 y = t 2<br />

Attenzione, adesso, perchè la derivata è in termini <strong>di</strong> t ma noi dobbiamo calcolare la<br />

tangente in un punto assegnato in<strong>di</strong>viduato dalle coor<strong>di</strong>nate (x, y) = (0, 4). Dobbiamo<br />

quin<strong>di</strong> determinare per quale/i valore/i <strong>di</strong> t si ottiene questo punto.<br />

Per la curva e il punto dati, deve quin<strong>di</strong> valere<br />

{<br />

x = t 5 − 4t 3 = 0<br />

y = t 2 = 4<br />

=⇒<br />

{<br />

t 3 (t 2 − 4) = 0 → t = 0, t = ±2<br />

t 2 = 4 → t = ±2<br />

Le soluzioni accettabili per le due equazioni sono t = ±2.<br />

Per t = −2 la pendenza della retta tangente risulta<br />

m = dy<br />

dx | t=−2 = − 1 8<br />

e quin<strong>di</strong> la retta tangente è<br />

y = 4 − 1 8 x<br />

Per t = 2 invece si ha<br />

m = dy<br />

dx | t=2 = 1 8<br />

e la retta tangente è<br />

y = 4 + 1 8 x<br />

Perchè due rette tangenti nel punto (0, 4) Perchè la curva ”gira“ attorno al punto (0, 4)<br />

e quin<strong>di</strong> abbiamo due rette tangenti (si veda Figura 5.5).<br />

65


5. LE CURVE<br />

Possiamo avere anche tangenti orizzontali o verticali, in un determinato punto <strong>di</strong> una<br />

curva, a seconda che la derivata <strong>di</strong> y o x rispetto a t sia nulla:<br />

G si ha una tangente orizzontale quando dy<br />

dt = 0 e dx<br />

dt ≠ 0<br />

G si ha una tangente verticale quando dx<br />

dt = 0 e dy<br />

dt ≠ 0.<br />

Possiamo anche scrivere le equazioni della retta tangente ad una curva parametrica in<br />

forma parametrica. Dato il punto P 0 = (x 0 , y 0 ) = (x(t 0 ), y(t 0 ), i valori delle derivate dx(t 0)<br />

,<br />

dt<br />

dy(t 0 )<br />

rappresentano i valori delle tangenti alla curva, componente per componente. L’equazione<br />

della retta tangente a P 0 , scritta in forma parametrica, deve passare per P 0 e<br />

dt<br />

avere come <strong>di</strong>rezione quella data dal vettore ⃗v che ha come componenti le due derivate<br />

⃗v = ( dx(t 0)<br />

, dy(t 0)<br />

). Scritta in forma vettoriale, la retta tangente deve essere della forma<br />

dt dt<br />

⃗r t = P 0 + t⃗v<br />

dove P 0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della<br />

retta, ⃗v è il vettore che dà la <strong>di</strong>rezione della retta. In forma parametrica abbiamo<br />

⃗r t = (x 0 + t dx(t 0)<br />

dt<br />

, y 0 + t dy(t 0)<br />

)<br />

dt<br />

Osserviamo che, dalle equazioni della tangente x = x 0 + t dx(t 0)<br />

, y = y 0 t dy(t 0)<br />

, se dalla<br />

dt<br />

dt<br />

prima equazione ricaviamo t in funzione <strong>di</strong> x e sostituiamo nella seconda equazione, troviamo<br />

l’equazione della retta tangente che abbiamo ricavato prima.<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione<br />

Prima <strong>di</strong> capire come si calcola la lunghezza <strong>di</strong> una curva parametrica, partiamo dal voler<br />

calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> funzione: data una funzione continua y = f(x) vogliamo<br />

determinare la lunghezza dell’arco della curva data dalla funzione nell’intervallo [a, b].<br />

Per prima cosa, <strong>di</strong>amo una stima approssimata della lunghezza <strong>di</strong> questa curva: <strong>di</strong>vi<strong>di</strong>amo<br />

l’intervallo [a, b] in n parti uguali <strong>di</strong> ampiezza ∆x ottenendo sulla curva n + 1 punti<br />

P i , i = 0, 1, 2, . . . , n. Possiamo quin<strong>di</strong> approssimare la curva me<strong>di</strong>ante una serie <strong>di</strong> segmenti<br />

congiungenti questi punti. Ve<strong>di</strong>amo in figura 5.6 un esempio con n = 9. Poichè la lunghezza<br />

<strong>di</strong> ciascuno dei segmenti congiungenti P i−1 e P i altro non è che la <strong>di</strong>stanza euclidea tra i due<br />

punti |P i − P i−1 |, la curva sarà dunque approssimata da<br />

L ≈<br />

n∑<br />

|P i−1 − P i |<br />

i=1<br />

Prendendo valori <strong>di</strong> n sempre più gran<strong>di</strong> noi avremo valori via via più accurati. Passando al<br />

limite per n → ∞ avremo la lunghezza dell’arco <strong>di</strong> curva:<br />

L = lim<br />

n→∞<br />

i=1<br />

n∑<br />

|P i−1 − P i |<br />

Ora, ciascuno punto P i ha coor<strong>di</strong>nate del tipo (x i , f(x i )), da cui<br />

|P i−1 − P i | = √ (x i − x i−1 ) 2 + (f(x i ) − f(x i−1 )) 2<br />

Dal teorema del valor me<strong>di</strong>o sappiamo che f(x i ) − f(x i−1 ) = f ′ (ξ i )(x i − x i−1 ) dove ξ i è un<br />

punto che non conosciamo all’interno dell’intervallo [x i−1 , x i ]. Ricordando che abbiamo <strong>di</strong>viso<br />

66


5.6. Lunghezza <strong>di</strong> una curva<br />

Figura 5.6: Approssimazione della lunghezza <strong>di</strong> un arco <strong>di</strong> funzione me<strong>di</strong>ante segmenti <strong>di</strong><br />

retta<br />

l’intervallo [a, b] <strong>di</strong> partenza in n parti uguali, si ha x i − x i−1 = ∆x da cui, f(x i ) − f(x i−1 ) =<br />

f ′ (ξ i )∆x da cui la lunghezza del segmento si può anche scrivere come<br />

|P i−1 − P i | = √ ∆x 2 + (f ′ (ξ i )∆x) 2 = √ (1 + f ′ (ξ i ) 2 )∆x 2 = √ (1 + f ′ (ξ i ) 2 )∆x<br />

Inserendo questa formula nel limite che fornisce la lunghezza dell’arco <strong>di</strong> curva si ha<br />

L = lim<br />

n→∞<br />

i=1<br />

n∑ √<br />

1 + f<br />

′<br />

(ξ i ) 2 ∆x<br />

Usando la definizione dell’integrale definito, questo limite non è nient’altro che un<br />

integrale e, precisamente,<br />

L =<br />

∫ b<br />

a<br />

√<br />

1 + f<br />

′<br />

(x) 2 dx<br />

In maniera equivalente, poichè y = f(x) possiamo riscrivere<br />

√<br />

∫ b<br />

( ) 2 dy<br />

L = 1 + dx<br />

dx<br />

a<br />

Se, invece, abbiamo una funzione scritta in funzione <strong>di</strong> y, vale a <strong>di</strong>re x = h(y) con c ≤ y ≤ d,<br />

la stessa formula <strong>di</strong>venta:<br />

√<br />

∫ d<br />

( ) 2 dx<br />

L = 1 + dy<br />

dy<br />

c<br />

5.6 Lunghezza <strong>di</strong> una curva<br />

Così come abbiamo trovato una formula per calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> una<br />

funzione y = f(x) o x = h(y), in maniera del tutto analoga, possiamo misurare la lunghezza<br />

<strong>di</strong> una curva.<br />

Sia data una curva in forma parametrica come<br />

x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />

67


5. LE CURVE<br />

Assumiamo che dx ≥ 0: ciò significa che la curva è attraversata solo una volta, da sinistra<br />

dt<br />

verso destra, per t che aumenta nell’intervallo [t 0 , t f ]. La curva, quin<strong>di</strong>, è semplice.<br />

Supponiamo, come per la tangente, <strong>di</strong> poter scrivere y = F (x) o x = H(y) anche se, in<br />

realtà, x = x(t) e y = y(t). Applicando le formule viste per l’arco <strong>di</strong> una funzione alla curva<br />

scritta non in forma parametrica noi dobbiamo applicare una delle due formule:<br />

L =<br />

L =<br />

∫ b<br />

a<br />

∫ d<br />

c<br />

√<br />

√<br />

1 +<br />

1 +<br />

( ) 2 dy<br />

dx se y = f(x), a ≤ x ≤ b<br />

dx<br />

( ) 2 dx<br />

dy se x = h(y), c ≤ y ≤ d<br />

dy<br />

Se lavoriamo considerando y = F (x), poichè x = x(t), operiamo un cambio <strong>di</strong> variabile<br />

per calcolare l’integrale: si ha dx = dx(t) dt (o equivalentemente, se consideriamo x = H(y),<br />

dt<br />

dy = dy<br />

dy dx<br />

dt), mentre per le derivate (o ) ci riconduciamo alle formule viste per la tangente.<br />

dt dx dy<br />

Quin<strong>di</strong> la formula per trovare la lunghezza dell’arco <strong>di</strong> una curva o, più semplicemente, la<br />

lunghezza <strong>di</strong> una curva, <strong>di</strong>venta:<br />

L =<br />

∫ tf<br />

⎛<br />

√ √√√√√<br />

⎜<br />

1 + ⎝<br />

t 0<br />

dy<br />

dt<br />

dx<br />

dt<br />

⎞<br />

2<br />

⎟<br />

⎠<br />

dx<br />

dt dt = ∫ tf<br />

√ √√√√√√√ ( dy<br />

dt<br />

1 + (<br />

t 0 dx<br />

dt<br />

) 2<br />

) 2<br />

dx<br />

dt dt<br />

Semplificando l’espressione sotto ra<strong>di</strong>ce otteniamo<br />

√<br />

∫ tf (dx ) 2 ( ) 2<br />

1<br />

dy dx<br />

L =<br />

t 0 dx<br />

+<br />

dt dt dt dt<br />

∣ dt ∣<br />

Nell’ipotesi fatta per cui dx è positiva possiamo semplificare ancora ottenendo<br />

dt<br />

√<br />

∫ tf (dx ) 2 ( ) 2 dy<br />

L =<br />

+ dt<br />

dt dt<br />

t 0<br />

Osserviamo che, nel caso in cui è dy ≥ 0, usando la formula per x in funzione <strong>di</strong> y, si<br />

dt<br />

ottiene<br />

L =<br />

∫ tf<br />

⎛<br />

√ √√√√√<br />

⎜<br />

1 + ⎝<br />

t 0<br />

dx<br />

dt<br />

dy<br />

dt<br />

⎞<br />

2<br />

⎟<br />

⎠<br />

dy<br />

dt dt<br />

da cui si arriva alla stessa formula.<br />

Se invece non rappresentiamo la curva me<strong>di</strong>ante la forma y = F (x) o x = H(y), arriviamo<br />

allo stesso risultato utilizzando un’approssimazione poligonale. Divi<strong>di</strong>amo l’intervall [t 0 , t f ] in<br />

n sottointervalli <strong>di</strong> stessa ampiezza ∆t. Chiamiamo t 0 , t 1 , t 2 , . . . , t n = t f i punti finali <strong>di</strong> questi<br />

68


5.6. Lunghezza <strong>di</strong> una curva<br />

sottointervalli e in<strong>di</strong>chiamo con (x i , y i ) i punti che si ottengono sulla curva con il parametro<br />

t i . Quin<strong>di</strong> x i = x(t i ) e y i = y(t i ). In<strong>di</strong>chiamo con P i i punti sul piano cartesiano che hanno<br />

coor<strong>di</strong>nate date da (x i , y i ).<br />

I punti P i si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da<br />

P i , che approssima la curva γ. Con lo stesso <strong>di</strong>scorso fatto per trovare la lunghezza <strong>di</strong> un<br />

arco <strong>di</strong> funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti<br />

P i−1 P i = |P i−1 − P i |<br />

Ora<br />

L ≈<br />

n∑<br />

|P i−1 − P i |<br />

i=1<br />

|P i−1 − P i | = √ (x i − x i−1 ) 2 + (y i − y i−1 ) 2 = √ (x(t i ) − x(t i−1 )) 2 + (yt i ) − y(t i−1 )) 2<br />

Applichiamo il teorema del Valor Me<strong>di</strong>o alla funzione x(t) nell’intervallo [t i−1 , t i ]:<br />

x(t i ) − x(t i−1 ) = x ′ (t ∗ i )∆t<br />

dove t ∗ i è un punto opportuno che si trova all’interno dell’intervallo [t i−1, t i ]. Analogamente,<br />

applicando lo stesso teorema alla funzione y(t) si ha<br />

y(t i ) − y(t i−1 ) = y ′ (t ∗∗<br />

i )∆t<br />

con t ∗∗<br />

i punto opportuno che si trova all’interno dell’intervallo [t i−1 , t i ]. Di conseguenza<br />

√<br />

√<br />

|P i−1 − P i | = [x ′ (t ∗ i )∆t]2 + [y ′ (t ∗∗<br />

i )∆t] 2 = [x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />

i )] 2 ∆t<br />

Sostituendo nell’espressione data per L e passando al limite per n → +∞ si ha<br />

L =<br />

lim<br />

n→+∞<br />

i=1<br />

n∑<br />

|P i−1 − P i | = lim<br />

n∑ √<br />

n→+∞<br />

i=1<br />

[x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />

i<br />

)] 2 ∆t<br />

Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell’arco <strong>di</strong><br />

una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t ∗ i e t ∗∗<br />

i<br />

che sono <strong>di</strong>versi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite<br />

scritto prima è lo stesso che si avrebbe con i due punti t ∗ i e t ∗∗<br />

i coincidenti. Quin<strong>di</strong> si può<br />

passare all’integrale<br />

L =<br />

∫ tf<br />

t 0<br />

√<br />

[x ′ (t)] 2 + [y ′ (t)] 2 dt<br />

Se, al posto <strong>di</strong> x ′ (t) scriviamo dx<br />

dt e, al posto <strong>di</strong> y′ (t) scriviamo dy<br />

dt<br />

prima per la lunghezza <strong>di</strong> una curva.<br />

Riassumiamo questo risultato nel teorema.<br />

otteniamo la formula vista<br />

Teorema 5.6.1 Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t),<br />

con t 0 ≤ t ≤ t f , e x ′ (t) e y ′ (t) sono funzioni continue e γ è una curva semplice (percorsa solo<br />

una volta per t crescente da t 0 a t f ), allora la lunghezza della curva è data da:<br />

L =<br />

∫ tf<br />

t 0<br />

√ (dx ) 2<br />

+<br />

dt<br />

( ) 2 dy<br />

dt<br />

dt<br />

69


5. LE CURVE<br />

Figura 5.7: cicloide<br />

Esempio<br />

Es. 5.6.1 Vogliamo determinare la lunghezza della curva<br />

x = 3 sin (t) y = 3 cos (t) 0 ≤ t ≤ 2π<br />

Riconosciamo un cerchio <strong>di</strong> centro l’origine e raggio 3.<br />

Per applicare la formula ci serve calcolare dx<br />

dt e dy<br />

dt :<br />

dx<br />

dt<br />

= 3 cos (t)<br />

dy<br />

dt<br />

= −3 sin (t)<br />

Dobbiamo quin<strong>di</strong> calcolare l’integrale<br />

L =<br />

= 3<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

√<br />

9 cos 2 (t) + 9 sin 2 (t)dt =<br />

∫ 2π<br />

√<br />

∫ 2π<br />

1dt = 3 dt = 3 · 2π = 6π<br />

0<br />

0<br />

√<br />

3 cos 2 (t) + sin 2 (t)dt =<br />

La lunghezza della curva è esattamente la lunghezza della circonferenza! In questo caso<br />

abbiamo una verifica imme<strong>di</strong>ata del risultato che abbiamo ottenuto.<br />

5.7 La curva cicloide<br />

La curva tracciata da un punto P sulla circonferenza <strong>di</strong> un cerchio quando il cerchio<br />

rotola su una linea retta è detta cicloide (si veda Figura 5.7). Per rappresentare questa curva<br />

scegliamo come parametro l’angolo <strong>di</strong> rotazione θ con cui si muove il cerchio. Per θ = 0 il<br />

punto P si trova all’origine <strong>degli</strong> assi cartesiani. Se il cerchio rotola <strong>di</strong> un angolo θ, poichè la<br />

circonferenza rimane sempre in contatto con la linea retta data dall’asse delle x, la <strong>di</strong>stanza<br />

del punto <strong>di</strong> contatto tra circonferenza e asse delle x (punto che chiamiamo T ) dall’origine<br />

coincide con la lunghezza dell’arco P T dove P è il punto che osserviamo quando il cerchio<br />

rotola (si veda la Figura 5.8):<br />

OT = arc(P T )<br />

L’angolo <strong>di</strong> rotazione θ è sotteso all’arco <strong>di</strong> estremi P e T . Poichè la lunghezza <strong>di</strong><br />

un arco è proporzionale all’ampiezza dell’angolo, considerando che all’angolo centrale 2π<br />

corrispondenza la lunghezza della circonferenza 2πr, possiamo scrivere<br />

θ<br />

2π = arc(P T )<br />

2πr<br />

Da questa relazione otteniamo arc(P T ) = rθ, da cui OT = rθ.<br />

70


5.8. Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />

Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio<br />

rotola lungo l’asse x.<br />

Figura 5.9: Rappresentazione grafica della curva cicloide per r = 2 e 0 ≤ θ ≤ 2π (a sinistra) e<br />

0 ≤ θ ≤ 8π (a destra).<br />

Questo risultato ci serve per trovare le coor<strong>di</strong>nate del punto P . Si ha infatti (aiutandoci<br />

con la Figura 5.8):<br />

x = OT − P Q<br />

y = CT − CQ<br />

Considerando il triangolo rettangolo <strong>di</strong> vertici P , Q e il centro della circonferenza C, il lato<br />

CP = r mentre i lati P Q e CQ sono dati dalle formule trigonometriche<br />

P Q = CP sin θ = r sin θ,<br />

CQ = CP cos θ = r cos θ<br />

. Il lato CT vale r. Inserendo queste relazioni nelle espressioni precedenti troviamo<br />

x = OT − P Q = rθ − r sin θ = r(θ − sin θ)<br />

y = CT − CQ = r − r cos θ = r(1 − cos θ)<br />

Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da<br />

x = r(θ − sin θ), y = r(1 − cos θ)<br />

Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2,<br />

esse sono valide anche per altri valori <strong>di</strong> θ. Un arco completo della curva cicloide è dato dalla<br />

rotazione completa della circonferenza e si ha, quin<strong>di</strong>, per θ ∈ [0, 2π].<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />

Siamo abituati a rappresentare un punto nel piano utilizzando le coor<strong>di</strong>nate cartesiane.<br />

Vi è tuttavia un altro sistema <strong>di</strong> coor<strong>di</strong>nate (introdotto da Newton) che può essere conve-<br />

71


5. LE CURVE<br />

Figura 5.10: Coor<strong>di</strong>nate polari.<br />

Figura 5.11: Passaggio da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane.<br />

niente per molti scopi, tra cui quello <strong>di</strong> rappresentare alcune curve parametriche. Questo<br />

sistema prende il nome <strong>di</strong> sistema <strong>di</strong> coor<strong>di</strong>nate polari.<br />

Scegliamo un punto nel piano che chiamiamo polo o origine (lo in<strong>di</strong>chiamo con O). Dall’origine<br />

tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato<br />

orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell’asse delle x<br />

del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il segmento,<br />

<strong>di</strong> lunghezza r, che unisce P all’origine e consideriamo l’angolo θ (<strong>di</strong> solito espresso<br />

in ra<strong>di</strong>anti) tra l’asse polare e il segmento OP . Il punto P viene rappresentato dalla coppia<br />

or<strong>di</strong>nata (r, θ) e r, θ sono le coor<strong>di</strong>nate polari del punto P (si veda Figura 5.10). Si usa la<br />

convenzione che un angolo è positivo se misurato in senso antiorario rispetto all’asse polare.<br />

Inoltre il punto (0, θ) rappresenta l’origine, qualunque sia θ.<br />

Si estende il sistema <strong>di</strong> coor<strong>di</strong>nate polari a valori <strong>di</strong> r negativi, con la convenzione che il<br />

punto del tipo (−r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa <strong>di</strong>stanza |r| da O,<br />

ma sul lato opposto rispetto a (r, θ). Dire (−r, θ) è la stessa cosa <strong>di</strong> (r, θ + π). Come conseguenza,<br />

un punto nel sistema <strong>di</strong> coor<strong>di</strong>nate polari può avere più <strong>di</strong> una rappresentazione.<br />

Dal momento che una completa rotazione antioraria è data dall’angolo 2π, si ha che il punto<br />

(r, θ) può essere rappresentato anche come (r, θ + 2nπ), e (−r, θ + (2n + 1)π) con n intero.<br />

Per passare dalla rappresentazione in coor<strong>di</strong>nate polari al sistema <strong>di</strong> coor<strong>di</strong>nate cartesiane,<br />

basta osservare che l’origine del sistema polare corrisponde all’origine del sistema cartesiano,<br />

l’asse polare corrisponde all’asse delle x e, <strong>di</strong> conseguenza, il punto P <strong>di</strong> coor<strong>di</strong>nate<br />

polari (r, θ), ha coor<strong>di</strong>nate cartesiane x e y date da<br />

x = r cos θ,<br />

y = r sin θ<br />

(si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati <strong>di</strong><br />

un triangolo rettangolo all’angolo compreso tra ipotenusa e uno dei due cateti). Viceversa,<br />

dato un punto P in coor<strong>di</strong>nate cartesiane, per trovare i valori <strong>di</strong> r e θ delle corrispondenti<br />

72


5.9. Curve in coor<strong>di</strong>nate polari<br />

Figura 5.12: Punto (1, −1) in coor<strong>di</strong>nate polari e cartesiane.<br />

coor<strong>di</strong>nate polari, possiamo sfruttare le relazioni<br />

r 2 = x 2 + y 2 , e tan θ = y x<br />

che ricaviamo dalle relazioni precedenti. Poichè tan θ = tan (θ + π), dobbiamo prestare attenzione<br />

a scegliere il valore <strong>di</strong> θ che permette <strong>di</strong> avere, nel piano polare, lo stesso punto del<br />

piano cartesiano.<br />

Esempio<br />

Es. 5.8.1 Convertiamo il punto (2, π/4) da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane. Da<br />

x = r cos θ e y = r sin θ, sostituendo i valori <strong>di</strong> r e θ otteniamo x = 2 cos (π/4) = 2 √<br />

2<br />

= √ 2 e<br />

y = 2 sin (π/4) = 2 √<br />

2<br />

= √ 2. In coor<strong>di</strong>nate cartesiane abbiamo il punto ( √ 2, √ 2).<br />

Esempio<br />

Es. 5.8.2 Rappresentiamo in coor<strong>di</strong>nate polari il punto dato in coor<strong>di</strong>nate cartesiane<br />

(1, −1).<br />

Scegliamo la rappresentazione con r > 0 andando a considerare la ra<strong>di</strong>ce positiva <strong>di</strong><br />

x 2 + y 2 . Quin<strong>di</strong> r = √ 1 + 1 = √ 2.<br />

Abbiamo da risolvere l’equazione tan θ = y x = −1.<br />

Sia θ = 3π 4 + 2nπ sia θ = −π + 2nπ con n intero (n = 0, 1, . . .) hanno come tangente il<br />

4<br />

valore −1. Scegliamo il valore <strong>di</strong> θ che ci permette (insieme a r = √ 2) <strong>di</strong> avere il punto<br />

P posizionato nel corretto quadrante: dobbiamo scegliere θ = − π 4 + 2nπ. Pren<strong>di</strong>amo<br />

θ = − π 4 . Il punto in coor<strong>di</strong>nate polari dato da (√ 2, − π ) corrisponde a (1, −1) in coor<strong>di</strong>nate<br />

4<br />

cartesiane. Se considerassimo il punto ( √ 2, 3π 4<br />

(si veda Figura 5.12 per un confronto).<br />

) avremmo, in coor<strong>di</strong>nate cartesiane (−1, 1)<br />

5.9 Curve in coor<strong>di</strong>nate polari<br />

Un’equazione polare del tipo r = f(θ) o, più in generale, F (r, θ) = 0 ha come grafico<br />

l’insieme <strong>di</strong> tutti i punti P <strong>di</strong> coor<strong>di</strong>nate polari (r, θ), che sod<strong>di</strong>sfano l’equazione. Possiamo<br />

dunque avere delle curve rappresentate me<strong>di</strong>ante coor<strong>di</strong>nate polari.<br />

73


5. LE CURVE<br />

Esempio<br />

Es. 5.9.1 La curva <strong>di</strong> equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal<br />

momento che r rappresenta la <strong>di</strong>stanza dei punti dal polo (l’origine del piano polare), la<br />

curva data rappresenta il cerchio <strong>di</strong> centro il polo O e raggio 4.<br />

Esempio<br />

Es. 5.9.2 La curva polare θ = π/5 consiste <strong>di</strong> tutti i punti (r, θ) con θ = π/5 ra<strong>di</strong>anti.<br />

Abbiamo quin<strong>di</strong> una retta che passa per O e che forma un angolo <strong>di</strong> π/5 ra<strong>di</strong>anti con<br />

l’asse polare.<br />

Esempio<br />

Es. 5.9.3 Troviamo le equazioni cartesiane della curva polare r = 2 cos θ.<br />

Se proviamo a fare il grafico della curva sul piano polare, al variare <strong>di</strong> θ, ci accorgiamo<br />

che il grafico rappresenta una circonferenza.<br />

Per passare a coor<strong>di</strong>nate cartesiane, da x = r cos θ abbiamo cos θ = x/r quin<strong>di</strong> r = 2 cos θ =<br />

2x/r, cioè r 2 = 2x ma r 2 = x 2 +y 2 , da cui x 2 +y 2 = 2x o ancora x 2 +y 2 −2x = 0. Aggiungendo<br />

e sottraendo 1 abbiamo<br />

x 2 + y 2 − 2x + 1 − 1 = 0 cioè (x − 1) 2 + y 2 = 1<br />

Abbiamo l’equazione della circonferenza <strong>di</strong> centro (1, 0) e raggio 1.<br />

5.9.1 La curva car<strong>di</strong>oide<br />

Stu<strong>di</strong>amo ora la curva car<strong>di</strong>oide, chiamata in questo modo perchè a forma <strong>di</strong> cuore, data<br />

dall’equazione r = 1 + sin θ.<br />

Per farne il grafico, facciamo prima <strong>di</strong> tutto il grafico, in coor<strong>di</strong>nate cartesiane, della<br />

funzione r = 1 + sin θ (si veda Figura 5.13, a sinistra), che altro non è che la funzione sin a<br />

cui è aggiunta un’unità. Per θ che varia da 0 a π/2, r cresce da 1 a 2. Ma r rappresenta<br />

la <strong>di</strong>stanza dal polo in coor<strong>di</strong>nate polari, perció nel grafico in coor<strong>di</strong>nate polari dobbiamo<br />

far variare r da 1 a 2 (in<strong>di</strong>chiamo con ➀ questa porzione <strong>di</strong> curva). Per θ che varia da π/2<br />

a π, r decresce da 2 a 1 perciò nella corrispondente curva polare dobbiamo rappresentare<br />

questa decrescita (in<strong>di</strong>cata nella regione ➁). Per θ ∈ [π, 3π/2] r decresce da 1 a 0 e si ha la<br />

corrispondente portione ➂ della curva polare. Infine, per θ ∈ [3π/2, 2π] r aumenta da 0 a 1,<br />

come mostrato nella porzione ➃.<br />

Se θ dovesse andare oltre 2π, la curva ripercorrebbe lo stesso percorso.<br />

5.10 Lunghezza <strong>di</strong> una curva polare<br />

Se vogliamo calcolare la lunghezza <strong>di</strong> una curva in coor<strong>di</strong>nate polari, la formula che<br />

abbiamo dato per la lunghezza <strong>di</strong> una curva parametrica si semplifica. Infatti, se passiamo a<br />

coor<strong>di</strong>nate cartesiane, le equazioni che caratterizzano la curva polare r = f(θ) con θ 0 ≤ θ ≤ θ f<br />

sono date da<br />

x = r cos θ = f(θ) cos θ,<br />

y = r sin θ = f(θ) sin θ<br />

Quin<strong>di</strong> x e y sono funzioni <strong>di</strong> θ. Assumendo che f ′ sia una funzione continua, la lunghezza<br />

della curva è data dalla formula<br />

√<br />

∫ θf (dx ) 2 ( ) 2 dy<br />

L =<br />

+ dθ<br />

dθ dθ<br />

74<br />

θ 0


5.10. Lunghezza <strong>di</strong> una curva polare<br />

Figura 5.13: Car<strong>di</strong>oide.<br />

Si ha (considerando che x e y sono date dal prodotto <strong>di</strong> due funzioni):<br />

dx<br />

dθ = f ′ (θ) cos θ − f(θ) sin θ = dr cos θ − r sin θ<br />

dθ<br />

dy<br />

dθ = f ′ (θ) sin θ + f(θ) cos θ = dr sin θ + r cos θ<br />

dθ<br />

Sfruttando il fatto che cos 2 θ + sin 2 θ = 1 si ha<br />

( ) 2 ( ) 2 ( ) 2 dx dy dr<br />

+ = cos 2 θ + r 2 sin 2 θ − 2r dr cos θ sin θ+<br />

dθ dθ dθ<br />

dθ<br />

( ) 2 dr<br />

+ sin 2 θ + r 2 cos 2 θ + 2r dr cos θ sin θ<br />

dθ<br />

dθ<br />

( ) 2 dr<br />

= (cos 2 θ + sin 2 θ) + r 2 (cos 2 θ + sin 2 θ)+<br />

dθ<br />

− 2r dr<br />

dr<br />

cos θ sin θ + 2r cos θ sin θ<br />

dθ dθ<br />

( ) 2 dr<br />

= + r 2<br />

dθ<br />

Andando a sostituire nell’integrale che dà la lunghezza della curva si ha<br />

√<br />

∫ θf<br />

( ) 2 dr<br />

L = r 2 + dθ<br />

dθ<br />

θ 0<br />

Abbiamo trovato una formula semplificata per la lunghezza della curva polare.<br />

5.10.1 Lunghezze <strong>di</strong> alcune curve<br />

La curva car<strong>di</strong>oide<br />

Calcoliamo la lunghezza della curva car<strong>di</strong>oide r = 1 + sin θ con θ ∈ [0, 2π].<br />

Poichè dr = cos θ la lunghezza della curva è data dall’integrale<br />

dθ<br />

∫ 2π √<br />

∫ 2π √<br />

L = (1 + sin θ)2 + cos 2 θdθ = 1 + sin 2 θ + 2 sin θ + cos 2 θdθ<br />

=<br />

0<br />

∫ 2π<br />

0<br />

0<br />

∫<br />

√ 2π √ √<br />

2 + 2 sin θdθ = 2 1 + sin θdθ<br />

0<br />

75


5. LE CURVE<br />

Per calcolare questo integrale moltiplichiamo e <strong>di</strong>vi<strong>di</strong>amo per √ 1 − sin θ ricavando<br />

L = √ 2<br />

= √ 2<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

√<br />

√ 1 − sin θ<br />

1 + sin θ √ dθ = √ ∫ 2π<br />

2<br />

1 − sin θ 0<br />

√<br />

cos2 θ<br />

√ dθ = √ ∫ 2π<br />

| cos θ|<br />

2 √ dθ<br />

1 − sin θ 0 1 − sin θ<br />

√<br />

1 − sin 2 θ<br />

√<br />

1 − sin θ<br />

dθ<br />

Abbiamo un integrale che <strong>di</strong>pende dal valore assoluto <strong>di</strong> cos θ: poichè cos θ è positivo per<br />

0 ≤ θ ≤ π/2 e per 3π/2 ≤ θ ≤ 2π, mentre è negativo per π/2 ≤ θ ≤ 3π/2, l’integrale si spezza nei<br />

tre integrali<br />

L = √ ∫ 2π<br />

| cos θ|<br />

2 √ dθ =<br />

1 − sin θ<br />

= √ 2<br />

0<br />

∫ π/2<br />

Osserviamo che<br />

∫<br />

cos θ<br />

√ dθ 1 − sin θ<br />

0<br />

cos θ<br />

√ dθ − √ ∫ 3π/2<br />

2<br />

1 − sin θ π/2<br />

cos θ<br />

√ dθ + √ ∫ 2π<br />

2<br />

1 − sin θ 3π/2<br />

cos θ<br />

√<br />

1 − sin θ<br />

dθ<br />

si può risolvere facendo il cambiamento <strong>di</strong> variabile u = sin θ da cui du = cos θdθ ricavando<br />

∫<br />

∫<br />

∫<br />

1<br />

−1<br />

D(1 − u)<br />

√ du = − √ du = − √ du = −2 √ 1 − u + costante<br />

1 − u 1 − u 1 − u<br />

Abbiamo considerato che la derivata <strong>di</strong> 1 − u vale −1 (l’abbiamo in<strong>di</strong>cata con D(1 − u) e che<br />

∫<br />

x n dx = xn+1<br />

n + 1 + costante.<br />

Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo<br />

L = √ [ ∣∣∣−2 √ ∣ ∣∣<br />

θ=π/2<br />

∣<br />

2 1 − sin θ − ∣−2 √ 1 − sin θ∣ θ=3π/2<br />

∣<br />

+ ∣−2 √ ]<br />

1 − sin θ∣ θ=2π<br />

θ=0<br />

θ=π/2<br />

θ=3π/2<br />

= √ 2 [( −2 √ 1 − 1 + 2 √ 1 − 0 ) − ( −2 √ 1 + 1 + 2 √ 1 − 1 ) + ( −2 √ 1 − 0 + 2 √ 1 + 1 )]<br />

= √ (<br />

2 2 + 2 √ 2 − 2 + 2 √ )<br />

2<br />

= √ (<br />

2 4 √ )<br />

2 = 8<br />

La lunghezza della curva car<strong>di</strong>oide vale 8.<br />

La spirale <strong>di</strong> Archimede<br />

La spirale <strong>di</strong> Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro<br />

assegnato, positivo e θ che varia nell’intervallo [0, θ f ] (si veda figura 5.14 per vedere cosa<br />

succede aumentando θ f ).<br />

Per calcolare la lunghezza <strong>di</strong> questa curva, poichè dρ = k si ha<br />

dθ<br />

L =<br />

∫ θf<br />

0<br />

√<br />

∫ θf √<br />

k2 + (kθ) 2 dθ = k 1 + θ2 dθ<br />

L’integrale da risolvere non è imme<strong>di</strong>ato nè semplice.<br />

0<br />

76


5.10. Lunghezza <strong>di</strong> una curva polare<br />

Figura 5.14: Spirale <strong>di</strong> Archimede con k = 2 e θ f = 2π (a sinistra) e θ f = 10π (a destra)<br />

Per capire come si arriva al risultato, ve<strong>di</strong>amo nei dettagli la sua risoluzione (specie perchè<br />

si tratta <strong>di</strong> un integrale che può capitare <strong>di</strong> incontrare anche in altre occasioni). 1<br />

Calcoliamo quin<strong>di</strong> l’integrale ∫ √ 1 + x 2 dx (per semplicità consideriamo l’integrale<br />

indefinito e usiamo x al posto <strong>di</strong> θ).<br />

Facciamo un cambiamento <strong>di</strong> variabile ponendo x = tan u. Sappiamo che D(tan u) =<br />

1<br />

cos 2 u . La funzione 1<br />

viene chiamiata anche secante (trigonometrica) e in<strong>di</strong>cata con il<br />

cos u<br />

simbolo sec u (sec u = 1 ). Per semplicità useremo anche noi questa terminologia.<br />

cos u<br />

Consideriamo, inoltre, queste relazioni che useremo nel seguito:<br />

G 1 + tan 2 u = 1 + sin2 u<br />

cos 2 u = cos2 u + sin 2 u<br />

cos 2 = 1<br />

u cos 2 u = sec2 u<br />

1<br />

G D(sec u) = D(<br />

cos u ) = sin u<br />

cos 2 u = tan u = tan u sec u<br />

cos u<br />

1<br />

Tornando all’integrale, da x = tan u si ha dx = D(tan u)du =<br />

cos 2 u du = sec2 udu.<br />

Sostituendo si ha<br />

I =<br />

∫ √1<br />

+ x2 dx =<br />

∫ √<br />

1 + tan 2 u sec 2 udu<br />

Per la relazione 1 + tan 2 u = sec 2 u si ha<br />

I =<br />

∫ √sec2<br />

u sec 2 udu<br />

Poichè u = arctan x, si ha −π/2 ≤ u ≤ π/2 e in questo intervallo cos u ≥ 0 da cui sec u ≥ 0,<br />

quin<strong>di</strong> √ sec u = sec u. Allora<br />

∫ √sec2<br />

∫<br />

I = u sec 2 udu = sec 3 udu<br />

L’integrale in sec 3 u si risolve riconducendosi all’integrale <strong>di</strong> sec u. Risolviamo prima quest’ultimo<br />

integrale (usando <strong>degli</strong> accorgimenti: come vedete, la strada per risolvere l’integrale<br />

<strong>di</strong> partenza è molto lunga).<br />

∫<br />

∫<br />

sec udu =<br />

=<br />

sec u + tan u<br />

sec u<br />

sec u + tan u du<br />

∫ sec 2 u + sec u tan u<br />

du<br />

sec u + tan u<br />

1 Se ci dovesse capitare <strong>di</strong> risolvere un esercizio arrivando ad un integrale del genere, dovremo ricordarci che<br />

esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quin<strong>di</strong><br />

torneremo su questi appunti per ricordarci quale sia il risultato dell’integrale).<br />

77


5. LE CURVE<br />

A questo punto si fa un cambiamento <strong>di</strong> variabile (ancora!), ponendo w = sec u + tan u (l’espressione<br />

al denominatore della funzione integranda), da cui dw = D(sec u + tan u)du =<br />

(sec u tan u + sec 2 u)du (ritroviamo l’espressione al numeratore della funzione integranda), da<br />

cui<br />

∫ sec 2 ∫<br />

u + sec u tan u 1<br />

du = dw = ln |w| + costante<br />

sec u + tan u<br />

w<br />

= ln | sec u + tan u| + costante<br />

Torniamo ora all’integrale <strong>di</strong> sec 3 u riscrivendo <strong>di</strong>versamente la funzione integranda:<br />

sec 3 u = sec3 u<br />

2<br />

= sec3 u<br />

2<br />

= sec3 u<br />

2<br />

= sec3 u<br />

2<br />

+ sec3 u<br />

2<br />

+ sec2 u sec u<br />

2<br />

+ (tan2 u + 1) sec u<br />

2<br />

+ tan2 u sec u<br />

+ sec u<br />

2 2<br />

= sec3 + tan 2 u sec u<br />

2<br />

+ sec u<br />

2<br />

Per calcolare l’integrale <strong>di</strong> sec 3 u dobbiamo integrare i due termini della somma in cui<br />

abbiamo scomposto sec 3 u. Del secondo termine sappiamo già quanto vale l’integrale. Per il<br />

primo, basta osservare che<br />

D(sec u tan u) = D(sec u) tan u + sec uD(tan u)<br />

= sec u tan u tan u + sec u sec 2 u<br />

= sec u tan 2 u + sec 3 u<br />

Ma allora<br />

∫ sec u tan 2 u + sec 3 ∫<br />

u 1<br />

du =<br />

2<br />

2 D(sec u tan u)du = 1 sec u tan u + costante<br />

2<br />

Ritornando all’integrale <strong>di</strong> prima e mettendo insieme i vari pezzi si ha<br />

∫<br />

sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />

2<br />

Quin<strong>di</strong> (finalmente siamo arrivati alla conclusione!!!!):<br />

∫ √1 ∫<br />

+ x2 dx = sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />

2<br />

Per tornare alla variabile originale x, da x = tan u si ha u = arctan x, da cui (sfruttando le<br />

proprietà viste prima <strong>di</strong> sec u e tan u) sec u = √ 1 + tan 2 u = √ 1 + x 2 . Perciò, sostituendo<br />

∫ √1<br />

+ x2 dx = 1 (<br />

x √ 1 + x<br />

2 2 + ln | √ )<br />

1 + x 2 + x| + costante<br />

Sappiamo ora calcolare la lunghezza della spirale <strong>di</strong> Archimede.<br />

Tornando alla formula<br />

∫ θf √<br />

L = k 1 + θ2 dθ<br />

abbiamo<br />

78<br />

L = k<br />

0<br />

[ 1<br />

(<br />

θ √ 1 + θ<br />

2 2 + ln | √ ) ] θ f<br />

1 + θ 2 + θ| = k √<br />

√<br />

)<br />

(θ f 1 + (θ f )<br />

0<br />

2<br />

2 + ln | 1 + (θ f ) 2 + θ f |


5.11. Funzioni a valori vettoriali<br />

5.11 Funzioni a valori vettoriali<br />

Abbiamo visto che una curva può essere rappresentata me<strong>di</strong>ante due equazioni parametriche<br />

che in<strong>di</strong>viduano l’ascissa e l’or<strong>di</strong>nata <strong>di</strong> ogni suo punto (se avessimo una curva nello<br />

spazio 3D avremmo tre equazioni, una per x, una per y, una per z).<br />

Queste equazioni sono un esempio <strong>di</strong> funzione a valori vettoriali. Nel caso della curva in<br />

2D possiamo definire una funzione f definita nell’insieme [t 0 , t f ] e a valori in R 2 : f : [t 0 , t f ] →<br />

R 2 tale che f = (x(t), y(t)) Al parametro t è associato il punto (x(t), y(t)), che possiamo vedere<br />

anche come un vettore <strong>di</strong> R 2 .<br />

Più in generale<br />

Definizione 5.11.1 f : I → R n con I ⊂ R k , (k, n interi) è una funzione vettoriale.<br />

Se la funzione vettoriale è data da f(t) = (f 1 (t), f 2 (t), . . . , f n (t)), possiamo calcolare la sua<br />

derivata, che è il vettore che ha come componenti le derivate delle componenti della funzione:<br />

f ′ (t) = (f 1(t), ′ f 2(t), ′ . . . , f n(t)). ′ Di questo vettore possiamo calcolare il modulo (che è una<br />

funzione <strong>di</strong> t): |f ′ (t)| = √ ∑ n<br />

i=1 (f i ′(t))2 .<br />

Nel caso 2D, se f(t) = (x(t), y(t)), si ha f ′ (t) = ( dx<br />

dt , dy<br />

dt ) e |f ′ (t)| =<br />

5.12 Le curve riviste come funzioni vettoriali<br />

Definizione 5.12.1<br />

f : [a, b] → R n<br />

G Si <strong>di</strong>ce curva <strong>di</strong> R n ogni applicazione<br />

√ (dx ) 2<br />

+<br />

dt<br />

( ) 2 dy<br />

dt<br />

G Si <strong>di</strong>ce sostegno (oppure traccia o traiettoria) della curva l’insieme f([a, b]) (il codominio<br />

della funzione).<br />

G Un curva f si <strong>di</strong>ce <strong>di</strong> classe C k se f è <strong>di</strong> classe C k ([a, b]) (cioè se ogni sua componente è <strong>di</strong><br />

classe C k ).<br />

La curva rappresentata dalla f viene detta anche curva γ.<br />

Definizione 5.12.2 Una curva γ si <strong>di</strong>ce regolare se<br />

1. la f è <strong>di</strong> classe C 1 ([a, b])<br />

2. ∀t ∈]a, b[: |f ′ (t)| > 0<br />

3. Se la f è una corrispondenza biunivoca tra [a, b] e f([a, b]) (si può avere una sola eccezione<br />

se la curva è chiusa, per cui f(a) = f(b))<br />

Definizione 5.12.3 Due funzioni vettoriali f : [a, b] → R n e g : [α, β] → R n rappresentanto la<br />

stessa curva γ se esiste una funzione Φ : [α, β] → [a, b], <strong>di</strong> classe C 1 e Φ ′ (u) > 0 ∀u ∈ [α, β], tale<br />

che Φ(α) = a Φ(β) = b<br />

G ∀u ∈ [α, β] : g(u) = (f ◦ Φ)(u) = f(Φ(u))<br />

Definizione 5.12.4 Una curva si <strong>di</strong>ce generalmente regolare o regolare a tratti se<br />

1. f è continua<br />

2. esiste un numero finito <strong>di</strong> punti a = t 0 < t 1 < . . . < t r = b tali che la f ristretta a ciascun<br />

sottointervallo [t i−1 , t i ], i = 1, 2, . . . , r rappresenti una curva regolare<br />

79


5. LE CURVE<br />

Esempio<br />

Es. 5.12.1 La curva data da<br />

x = t y = |t| − 1 ≤ t ≤ 1<br />

non è regolare perchè non è derivabile per t = 0, ma la curva è generalmente regolare<br />

perchè ristretta a [−1, 0] e [0, 1] è regolare.<br />

5.13 Retta tangente ad una curva<br />

Definizione 5.13.1 Data una curva γ <strong>di</strong> classe C 1 , data dalla funzione vettoriale<br />

f : [a, b] → R n<br />

sia t p ∈]a, b[, con f ′ (t p ) ≠ 0.<br />

Si definisce retta tangente alla curva γ nel punto f(t p ) la retta passante per f(t p ) e avente<br />

come <strong>di</strong>rezione quella del vettore f ′ (t p ):<br />

⃗r t = f(t p ) + tf ′ (t p )<br />

t ∈ R<br />

Nel caso 2D ritroviamo la retta che avevamo introdotto a pag. 66:<br />

⃗r t = (x(t p ) + dx(t p)<br />

dt<br />

t, y(t p ) + dy(t p)<br />

t)<br />

dt<br />

Definizione 5.13.2 Il vettore f ′ (t p ) si <strong>di</strong>ce vettore tangente alla curva γ in f(t p ).<br />

In R 2 il vettore tangente si in<strong>di</strong>ca anche come<br />

f ′ (t p ) = x ′ (t)⃗i + y ′ (t)⃗j<br />

5.14 Curve orientate<br />

L’orientamento naturale <strong>di</strong> una curva è quello dato da valori crescenti <strong>di</strong> t. Per <strong>di</strong>re che<br />

la curva ha l’orientamento naturale la si in<strong>di</strong>ca come +γ.<br />

L’orientamento <strong>di</strong> una curva può essere data dal versore<br />

τ(t) = f ′ (t)<br />

|f ′ (t)|<br />

Definizione 5.14.1 Data una curva γ <strong>di</strong> classe C 1 , data da f : [a, b] → R n si chiama curva<br />

opposta la curva Γ data da F : [−b, −a] → R n per la quale F(u) = f(−u)<br />

La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio<br />

per questo motivo, si può in<strong>di</strong>care con −γ la curva opposta +Γ.<br />

5.15 Di nuovo sulla lunghezza <strong>di</strong> una curva<br />

Diamo qualche cenno su come si arriva alla lunghezza <strong>di</strong> una curva.<br />

Data una curva γ <strong>di</strong> classe C 0 , sia data una sud<strong>di</strong>visione dell’intervallo [a, b] me<strong>di</strong>ante i<br />

punti a = t 0 < t 1 < . . . < t r = b. Si consideri la poligonale che congiunge i punti f(t i ). Si<br />

<strong>di</strong>ce lunghezza della curva γ l’estremo superiore dell’insieme costituito dalle lunghezze delle<br />

80


5.16. L’ascissa curvilinea<br />

poligonali così create, considerando tutte le possibili sud<strong>di</strong>visioni dell’intervallo [a, b] fatte<br />

con un numero finito <strong>di</strong> punti.<br />

Una curva che ha lunghezza finita si <strong>di</strong>ce rettificabile.<br />

Una curva regolare è rettificabile e la sua lunghezza è data da<br />

L =<br />

∫ b<br />

a<br />

|f ′ (t)|dt<br />

Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza.<br />

Per una curva regolare a tratti si ha un’analoga definizione, considerando la somma delle<br />

lunghezze delle curve regolari <strong>di</strong> cui è composta.<br />

Proposizione 5.15.1 L’integrale che fornisce la lunghezza <strong>di</strong> una curva non cambia se si<br />

considera la curva opposta a quella data o se si considera la curva me<strong>di</strong>ante rappresentazioni<br />

equivalenti.<br />

5.16 L’ascissa curvilinea<br />

Data una curva regolare orientata +γ data da f : [a, b] → R n si definisca la funzione reale<br />

s(t) data da<br />

{∫ t<br />

a |f ′ (u)|du per t ≠ a<br />

s(t) =<br />

0 per t = a<br />

Questa funzione rappresenta la lunghezza dell’arco <strong>di</strong> curva tra f(a) e f(t) ed è detta ascissa<br />

curvilinea. È una funzione crescente poichè s ′ (t) = |f ′ (t)| > 0 (essendo la curva regolare).<br />

La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che ∀s ∈ [0, L] (dove L è la<br />

lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ ′ (s) > 0.<br />

Ma, allora, f è equivalente alla funzione g = f ◦ Φ. La funzione g <strong>di</strong>pende dall’ascissa<br />

curvilinea s.<br />

La rappresentazione <strong>di</strong> una curva me<strong>di</strong>ante l’ascissa curvilinea non <strong>di</strong>pende dalla<br />

rappresentazione parametrica da cui si è partiti.<br />

Proposizione 5.16.1 La derivata <strong>di</strong> g ha modulo unitario (o norma unitaria).<br />

Dimostrazione.<br />

|g ′ (s)| = |(f ◦ Φ) ′ (s)| = |f ′ (Φ(s))Φ ′ (s)| = |f ′ (Φ(s))|Φ ′ (s)<br />

Non abbiamo considerato il modulo <strong>di</strong> Φ ′ (s) essendo questa funzione positiva e scalare.<br />

Poichè Φ è la funzione inversa <strong>di</strong> s, per la derivata vale Φ ′ 1<br />

(s) =<br />

s ′ (la derivata della<br />

(Φ(s))<br />

inversa <strong>di</strong> una funzione è uguale al reciproco della derivata della funzione stessa), andando<br />

a sostituire, si trova:<br />

|g ′ (s)| = 1<br />

✔<br />

Considerando il <strong>di</strong>fferenziale dell’ascissa curvilinea si ha la cosiddetta lunghezza dell’arco<br />

elementare:<br />

ds = |f ′ (t)|dt<br />

81


CAPITOLO 6<br />

Superfici parametriche<br />

Secondo alcuni autorevoli testi<br />

<strong>di</strong> tecnica aeronautica, il<br />

calabrone non può volare, a<br />

causa della forma e del peso<br />

del proprio corpo in rapporto<br />

alla superficie alare. Ma il<br />

calabrone non lo sa e perciò<br />

continua a volare.<br />

Igor Ivanovich Sikorsky<br />

(1889-1972)<br />

6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . . 87<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . . 87<br />

6.1 Superfici parametriche<br />

Così come una curva è stata rappresentata in forma parametrica, anche una superficie<br />

può essere rappresentata in forma parametrica me<strong>di</strong>ante tre funzioni (una per x, una per y,<br />

una per z) <strong>di</strong>pendenti da due parametri, dette equazioni parametriche della superficie<br />

x = x(u, v) y = y(u, v) z = z(u, v).<br />

Alla stessa maniera con cui abbiamo visto le equazioni <strong>di</strong> una curva parametrica come<br />

una funzione vettoriale, anche una superficie parametrica può essere vista come una<br />

funzione vettoriale che <strong>di</strong>pende da due variabili ⃗r : R 2 −→ R 3 , tale che<br />

⃗r(u, v) = (x(u, v), y(u, v), z(u, v))<br />

La funzione vettoriale è definita su una regione D del piano uv e l’insieme dei punti<br />

(x, y, z) ∈ R 3 , che sono i valori della funzione vettoriale, prende il nome <strong>di</strong> superficie<br />

parametrica S.<br />

83


6. SUPERFICI PARAMETRICHE<br />

Figura 6.1: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u.<br />

Figura 6.2: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u con 0 ≤ u ≤ π/4, 0 ≤ v ≤ 1.<br />

Esempio<br />

Es. 6.1.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />

x = 4 cos u, y = v, z = 4 sin u<br />

Cerchiamo <strong>di</strong> capire <strong>di</strong> quale superficie si tratta.<br />

Da x 2 + z 2 = 16 cos 2 u + 16 sin 2 u = 16 deduciamo che sezioni verticali parallele al piano<br />

xz, vale a <strong>di</strong>re per y costante, sono tutte circonferenze <strong>di</strong> raggio 4. Dal momento che<br />

l’equazione parametrica per y è proprio y = v, e v ∈ R, la superficie è un cilindro circolare<br />

<strong>di</strong> raggio 4 il cui asse è l’asse delle y (si veda Figura 6.1).<br />

Esempio<br />

Es. 6.1.2 Nell’esempio <strong>di</strong> prima, non c’erano limitazioni ai parametri u e v. Se invece<br />

poniamo delle limitazioni avremo una porzione <strong>di</strong> cilindro. Facciamo variare u in [0, π/4]<br />

e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo.<br />

84


6.1. Superfici parametriche<br />

Figura 6.3: Rappresentazione delle coor<strong>di</strong>nate sferiche.<br />

Se una superficie parametrica S è data dalla funzione vettoriale ⃗r(u, v), è utile definire due<br />

famiglie <strong>di</strong> curve che si trovano sulla superficie: una famiglia <strong>di</strong> curve che si ha considerando<br />

u costante e l’altra che si ha considerando v costante. Queste due famiglie corrispondono a<br />

linee verticali e orizzontali nel piano uv.<br />

Prendendo u = u 0 , la funzione vettoriale ⃗r(u 0 , v) <strong>di</strong>venta una funzione vettoriale <strong>di</strong>pendente<br />

dal solo parametro v e definisce una curva γ 1 che giace sulla superficie S. Analogamente,<br />

per v = v 0 , si ha la curva γ 2 data da ⃗r(u, v 0 ) sulla superficie S.<br />

Le due curve prendono il nome <strong>di</strong> curve coor<strong>di</strong>nate o curve <strong>di</strong> griglia. I grafici che abbiamo<br />

fatto per visualizzare le superfici <strong>degli</strong> esempi precedenti mostrano queste curve coor<strong>di</strong>nate.<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche<br />

Per visualizzare il grafico delle superfici, a volte è utile rappresentare le superfici in un<br />

sistema <strong>di</strong> coor<strong>di</strong>nate che non è quello cartesiano. Ve<strong>di</strong>amo nel dettaglio il sistema <strong>di</strong> coor<strong>di</strong>nate<br />

sferiche, dove un punto P che ha coor<strong>di</strong>nate (x, y, z) nello spazio cartesiano viene<br />

rappresentato in coor<strong>di</strong>nate sferiche me<strong>di</strong>ante (ρ, θ, φ) (si veda Figura 6.3): ρ rappresenta la<br />

<strong>di</strong>stanza del punto P dall’origine dello spazio cartesiano (ρ = √ x 2 + y 2 + z 2 ), θ rappresenta<br />

l’angolo che si ha tra la proiezione del punto P sul piano xy e l’asse positivo dell’asse x (in<br />

altri termini, è la coor<strong>di</strong>nata polare θ della proiezione <strong>di</strong> P sul piano xy), mentre φ è l’angolo<br />

tra l’asse positivo dell’asse z e il segmento OP . Quin<strong>di</strong> ρ ≥ 0 e 0 ≤ φ ≤ π. Questo sistema <strong>di</strong><br />

coor<strong>di</strong>nate è utile in presenza <strong>di</strong> simmetrie intorno all’origine.<br />

La relazione tra coor<strong>di</strong>nate cartesiane e coor<strong>di</strong>nate sferiche, tiene conto delle relazioni<br />

trigonometriche. In Figura 6.4 ve<strong>di</strong>amo i due triangoli rettangoli OP Q e OP P ′ . Il triangolo<br />

OP Q ha i lati OQ e OP <strong>di</strong> lunghezza z e ρ rispettivamente, e, per le relazioni sui lati e angoli<br />

<strong>di</strong> un triangolo rettangolo vale z = ρ cos φ. Il triangolo OP P ′ ha uno dei suoi cateti, in<strong>di</strong>cato<br />

con r, che è dato dalla proiezione <strong>di</strong> OP sul piano xy. Vale r = ρ sin φ. Le coor<strong>di</strong>nate x e y<br />

sono cateti del triangolo che si forma sul piano xy e che ha come ipotenusa proprio r, da cui<br />

x = r cos θ e y = r sin θ, vale a <strong>di</strong>re x = ρ sin φcosθ e y = ρ sin φ sin θ.<br />

Riassumendo, le coor<strong>di</strong>nate sferiche <strong>di</strong> P sono date da<br />

x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ<br />

Viceversa, considerando la formula della <strong>di</strong>stanza <strong>di</strong> un punto P dall’origine e sosituendo i<br />

85


6. SUPERFICI PARAMETRICHE<br />

Figura 6.4: Relazione tra coor<strong>di</strong>nate cartesiane e sferiche.<br />

Figura 6.5: Superficie sferica. Il grafico è fatto usando coor<strong>di</strong>nate cartesiane (a sinistra) e<br />

coor<strong>di</strong>nate sferiche (a destra).<br />

valori appena trovati si ricava:<br />

√<br />

x2 + y 2 + z 2 =<br />

√<br />

ρ 2 sin 2 φ cos 2 θ + ρ 2 sin 2 φ sin 2 θ + ρ 2 cos 2 φ = ρ<br />

Esempio<br />

Es. 6.1.3 L’equazione <strong>di</strong> una sfera <strong>di</strong> centro l’origine e raggio r è data da x 2 +y 2 +z 2 = r 2 .<br />

Possiamo descrivere la sfera usando equazioni parametriche del tipo<br />

x = x, y = y, z = ± √ r 2 − x 2 − y 2<br />

Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici,<br />

otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappresentate<br />

ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e,<br />

in corrispondenza dei buchi abbiamo delle ra<strong>di</strong>ci quadrate <strong>di</strong> valori negativi! Se usiamo<br />

invece coor<strong>di</strong>nate sferiche, i punti hanno coor<strong>di</strong>nate con ρ = r, da cui,<br />

x = r sin φ cos θ, y = r sin φ sin θ, z = r cos φ, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π<br />

86


6.2. Piano tangente a una superficie parametrica<br />

Il grafico della sfera usando le coor<strong>di</strong>nate sferiche è in Figura 6.5 a destra. Osserviamo<br />

come la superficie sia ben rappresentata. In questo caso le curve coor<strong>di</strong>nate<br />

per φ costante sono delle circonferenze <strong>di</strong> valore costante (che corrispondono ai noti<br />

paralleli che si stu<strong>di</strong>ano in geografia). Per θ costante abbiamo invece i meri<strong>di</strong>ani<br />

(semicirconferenze perchè 0 ≤ φ ≤ π) che collegano polo nord e polo sud.<br />

6.2 Piano tangente a una superficie parametrica<br />

Data una superficie parametrica S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), vogliamo<br />

calcolare l’equazione del piano tangente alla superficie in un punto P 0 (x 0 , y 0 , z 0 ) che vi<br />

appartiene. Esiste quin<strong>di</strong> una coppia <strong>di</strong> valori (u 0 , v 0 ) tale che P 0 = ⃗r(u 0 , v 0 ).<br />

Per calcolare il piano tangente, facciamo questo tipo <strong>di</strong> ragionamento. Fissando u =<br />

u 0 , le equazioni parametriche della superficie <strong>di</strong>ventano ⃗r(u 0 , v) = (x(u 0 , v), y(u 0 , v), z(u 0 , v)):<br />

abbiamo una funzione vettoriale che <strong>di</strong>pende dalla sola variabile v e che definisce una curva<br />

parametrica γ 1 nello spazio R 3 . Questa curva giace sulla superficie S.<br />

Scriviamo le equazioni parametriche della retta tangente a questa curva (si veda pag. 80),<br />

considerando che quella che è la derivata della funzione x(u 0 , v) rispetto a v nel punto v = v 0<br />

altro non è che la derivata parziale della funzione x(u, v) rispetto a v nel punto (u 0 , v 0 ) (stesso<br />

<strong>di</strong>scorso vale per y e per z). Otteniamo<br />

retta ⃗ tv = (x 0 + t ∂x(u 0, v 0 )<br />

∂v<br />

, y 0 + t ∂y(u 0, v 0 )<br />

∂v<br />

, z 0 + t ∂z(u 0, v 0 )<br />

)<br />

∂v<br />

Abbiamo chiamato questa retta con retta ⃗ tv perchè è la retta tangente alla curva che <strong>di</strong>pende<br />

dalla variabile v poichè u = u 0 costante. Di conseguenza, la pendenza <strong>di</strong> questa retta, vale a<br />

<strong>di</strong>re, la tangente alla curva γ 1 nel punto x(u 0 , v 0 ), y(u 0 , v 0 ) è data dal vettore<br />

⃗r tv = ( ∂x(u 0, v 0 )<br />

∂v<br />

, ∂y(u 0, v 0 )<br />

∂v<br />

, ∂z(u 0, v 0 )<br />

)<br />

∂v<br />

Allo stesso modo, possiamo fissare v = v 0 e considerare che le equazioni parametriche della<br />

superficie, in questo caso, si riducono alle equazioni parametriche <strong>di</strong> una curva nello<br />

spazio R 3 che <strong>di</strong>pendono dalla variabile u. Analogamente, possiamo scrivere le equazioni<br />

parametriche della retta tangente a questa curva nel punto P 0 , ottenendo<br />

retta ⃗ tu = (x 0 + t ∂x(u 0, v 0 )<br />

∂u<br />

, y 0 + t ∂y(u 0, v 0 )<br />

∂u<br />

La pendenza <strong>di</strong> questa retta è data dal vettore<br />

⃗r tu = ( ∂x(u 0, v 0 )<br />

∂u<br />

, ∂y(u 0, v 0 )<br />

∂u<br />

, ∂z(u 0, v 0 )<br />

)<br />

∂u<br />

, z 0 + t ∂z(u 0, v 0 )<br />

)<br />

∂u<br />

Una volta ottenute queste due rette, il piano tangente alla superficie è il piano in<strong>di</strong>viduato<br />

dalle <strong>di</strong>rezioni <strong>di</strong> queste due rette, cioè dai due vettori ⃗r tu e ⃗r tv . Consideriamo dei brevi<br />

richiami sulle equazioni <strong>di</strong> un piano in R 3 .<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano<br />

Supponiamo <strong>di</strong> avere un punto P 0 = (x 0 , y 0 , z 0 ) su un piano nello spazio R 3 . Supponiamo<br />

<strong>di</strong> avere anche un vettore ⃗n che è normale a questo piano:<br />

Assumiamo <strong>di</strong> conoscere un altro generico punto P = (x, y, z) che giace sul piano.<br />

In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si<br />

veda figura 6.6). Possiamo costruire il vettore ⃗r − ⃗r 0 che giace interamente nel piano. Per<br />

87


6. SUPERFICI PARAMETRICHE<br />

Figura 6.6: piano nello spazio<br />

semplicità, nella figura 6.6 abbiamo messo sul piano il vettore ⃗n (anche se esso potrebbe<br />

stare da tutt’altra parte). Ora, poichè ⃗n è ortogonale al piano, esso è ortogonale ad ogni<br />

vettore che giace nel piano. In particolare esso è ortogonale al vettore ⃗r − ⃗r 0 . Vale dunque:<br />

⃗n · (⃗r − ⃗r 0 ) = 0<br />

Se ⃗n è un vettore <strong>di</strong> componenti (a, b, c), poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 , z − z 0 ), il prodotto<br />

scalare <strong>di</strong>venta<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />

Questa è l’equazione scalare del piano. Spesso troviamo l’equazione scritta nella forma<br />

ax + by + cz = d dove d = ax 0 + by 0 + cz 0<br />

Osserviamo quin<strong>di</strong> che, data l’equazione <strong>di</strong> un piano possiamo ricavare facilmente un vettore<br />

normale al piano: esso è dato da ⃗n = (a, b, c).<br />

Ora, dati due vettori ⃗a e ⃗ b in R 3 , il prodotto vettoriale ⃗a × ⃗ b è un vettore che punta nella<br />

<strong>di</strong>rezione perpen<strong>di</strong>colare al piano in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b, mentre la sua lunghezza<br />

è data da<br />

|⃗a × ⃗ b| = |⃗a|| ⃗ b| sin θ<br />

dove θ è l’angolo compreso dai due vettori (0 ≤ θ ≤ π). Da questa formula deduciamo che<br />

se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come<br />

interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l’area<br />

del parallelogramma in<strong>di</strong>viduato dai vettori ⃗a e ⃗ b. Per trovare le componenti del prodotto<br />

vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i<br />

versori dell’asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti<br />

del vettore ⃗a e sulla terza riga le componenti del vettore ⃗ b. Si calcola il determinante della<br />

matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia ⃗a = (a 1 , a 2 , a 3 )<br />

e ⃗ b = (b 1 , b 2 , b 3 ). I versori unitari dei tre assi siano dati da ⃗i, ⃗j, ⃗ k. Il prodotto vettoriale ⃗a × ⃗ b è<br />

dato da<br />

∣ ⃗a × ⃗ ⃗i ⃗j ⃗ k ∣∣∣∣∣ b =<br />

a 1 a 2 a 3 =⃗i<br />

∣ a ∣ 2 a 3∣∣∣<br />

− ⃗j<br />

∣<br />

b 2 b 3<br />

∣ a ∣ 1 a 3∣∣∣<br />

+<br />

b 1 b ⃗ k<br />

3<br />

∣ a ∣<br />

1 a 2∣∣∣<br />

b 1 b 2<br />

b 1 b 2 b 3<br />

88<br />

=⃗i(a 2 b 3 − b 2 a 3 ) − ⃗j(a 1 b 3 − b 1 a 3 ) + ⃗ k(a 1 b 2 − b 1 a 2 )<br />

= (a 2 b 3 − b 2 a 3 , b 1 a 3 − a 1 b 3 , a 1 b 2 − b 1 a 2 )


6.2. Piano tangente a una superficie parametrica<br />

Quin<strong>di</strong> se abbiamo due vettori ⃗a e ⃗ b che si trovano sul piano <strong>di</strong> cui vogliamo scrivere l’equazione,<br />

il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per<br />

scrivere l’equazione del piano tangente.<br />

Tornando al piano tangente ad una superficie parametrica in un punto P 0 , poichè abbiamo<br />

trovato i due vettori tangenti ⃗r tu e ⃗r tv che si trovano sul piano tangente alla superficie,<br />

allora il piano tangente è in<strong>di</strong>viduato dal vettore ⃗n = ⃗r tu × ⃗r tv (i due vettori non devono essere<br />

tangenti tra loro).<br />

Esempio<br />

Es. 6.2.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />

x = 2u 2 , y = 3v 2 , z = 3u + 5v<br />

Vogliamo trovare l’equazione del piano tangente alla superficie nel punto P 0 (2, 3, 8).<br />

Notiamo che questo punto si ha per u = v = 1.<br />

Calcoliamo i due vettori tangenti ⃗r tu e ⃗r tv .<br />

Poichè<br />

∂x<br />

∂u = 4u,<br />

∂y<br />

∂u = 0,<br />

∂z<br />

∂u = 3<br />

valutando queste derivate in (1, 1) abbiamo<br />

⃗r tu = (4, 0, 3)<br />

Analogamente, poichè<br />

∂x<br />

∂v = 0,<br />

∂y<br />

∂v = 6v,<br />

∂z<br />

∂v = 5<br />

valutando queste derivate in (1, 1) abbiamo<br />

⃗r tv = (0, 6, 5)<br />

Il prodotto vettoriale è<br />

⃗i ⃗j ⃗ k<br />

⃗r tu × ⃗r tv =<br />

4 0 3<br />

∣0 6 5∣ = (−18) ⃗i − (12)⃗j + (24) ⃗ k = (−18, −12, 24)<br />

Quin<strong>di</strong> il piano tangente è dato da<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />

dove (a, b, c) = (−18, −12, 24) e (x 0 , y 0 , z 0 ) = (2, 3, 8) = P 0 , da cui<br />

o ancora<br />

−18(x − 2) − 12(y − 3) + 24(z − 8) = 0<br />

−18x + 36 − 12y + 36 + 24z − 192 = 0 =⇒ 24z − 12y − 18x − 120 = 0 =⇒ 2z − y − 1.5x − 10 = 0<br />

89


CAPITOLO 7<br />

Integrali<br />

Compito della scienza non è<br />

aprire una porta all’infinito<br />

sapere, ma porre una barriera<br />

all’infinita ignoranza.<br />

Galileo Galilei (1564-1642)<br />

7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . . 91<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . . 92<br />

7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />

7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />

7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />

7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />

7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

7.1 Integrali <strong>di</strong>pendenti da parametri<br />

Analizziamo brevemente gli integrali <strong>di</strong>pendenti da parametri, vedendo il caso in cui la<br />

funzione integranda <strong>di</strong>pende da una sola variabile e il caso in cui <strong>di</strong>pende da due variabili.<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile<br />

Se f : I −→ R con I ⊂ R è una funzione continua, fissato x 0 ∈ I si può definire la funzione<br />

F (x) =<br />

∫ x<br />

x 0<br />

f(t)dt<br />

Questa funzione prende il nome <strong>di</strong> funzione integrale della f <strong>di</strong> punto iniziale x 0 .<br />

91


7. INTEGRALI<br />

Proposizione 7.1.1 Se G è una primitiva della f (quin<strong>di</strong> G ′ = f) si ha<br />

F (x) =<br />

∫ x<br />

x 0<br />

f(t)dt = G(x) − G(x 0 )<br />

La funzione F è a sua volta una primitiva <strong>di</strong> f.<br />

Dimostrazione. Infatti F ′ (x) = d ( ∫ x<br />

dx<br />

x 0<br />

f(t)dt)<br />

= d(G(x) − g(x 0))<br />

= f(x). ✔<br />

dx<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili<br />

Se f : I −→ R con I ⊂ R 2 è una funzione continua, si può definire la funzione<br />

F (y 0 , y 1 , x) =<br />

∫ y1<br />

y 0<br />

f(x, y)dy<br />

Quin<strong>di</strong>, fissato un certo valore <strong>di</strong> x, calcoliamo l’integrale della funzione f(x, y), come funzione<br />

che <strong>di</strong>pende solo da y, per y 0 ≤ y ≤ y 1 . Al variare <strong>di</strong> x varia l’integrale. E l’integrale varia<br />

anche al variare <strong>di</strong> y 0 e y 1 , perciò è una funzione che <strong>di</strong>pende da tre variabili, y 0 , y 1 e x.<br />

La F è una funzione continua.<br />

Proposizione 7.1.2 Se f è continua, la F è derivabile rispetto a y 0 e y 1 e vale<br />

∂F<br />

∂y 1<br />

= f(x, y 1 )<br />

∂F<br />

∂y 0<br />

= −f(x, y 0 )<br />

Dimostrazione.<br />

La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y 1 (che<br />

è il secondo estremo dell’intervallo <strong>di</strong> integrazione), posso considerare la F come funzione<br />

integrale <strong>di</strong> una funzione <strong>di</strong>pendente da una sola variabile. In particolare, fissati x e y 0 ,<br />

considero la funzione g(y) = f(x, y) e<br />

F 1 (y 1 ) = F (y 0 , y 1 , x) =<br />

∫ y1<br />

y 0<br />

g(y)dy<br />

Mi riconduco dunque al caso visto prima, da cui F ′ 1(y 1 ) = g(y 1 ). Ma g(y 1 ) = f(x, y 1 ) e F ′ 1(y 1 )<br />

altro non è che la derivata della funzione F per y 0 e x fissati, quin<strong>di</strong> F ′ 1(y 1 ) = ∂F (y 0, y 1 , x)<br />

∂y 1<br />

Ricaviamo dunque<br />

∂F (y 0 , y 1 , x)<br />

∂y 1<br />

= f(x, y 1 )<br />

Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare<br />

che ∫ b<br />

a g(x)dx = − ∫ a<br />

g(x)dx da cui<br />

b<br />

∫ y1<br />

∫ y0<br />

f(x, y)dy = − f(x, y)dy<br />

y 0<br />

y 1<br />

92


7.2. Richiamo sugli integrali semplici<br />

Utilizzando questa formula e il risultato precendente, e scambiando il ruolo <strong>di</strong> y 0 e y 1<br />

troviamo che vale 1<br />

∂F (y 0 , y 1 , x)<br />

∂y 0<br />

= −f(x, y 0 )<br />

✔<br />

Si può pensare, della F <strong>di</strong> voler calcolare anche la derivata parziale rispetto alla x. In tal<br />

caso vale la relazione<br />

∫<br />

∂F<br />

y1<br />

∂x = ∂f(x, y)<br />

dy<br />

y 0<br />

∂x<br />

Valgono inoltre le seguenti proposizioni<br />

Proposizione 7.1.3 Se f è <strong>di</strong> classe C 1 anche F è <strong>di</strong> classe C 1 .<br />

Se si fa variare y in un certo intervallo definito da due funzioni <strong>di</strong>pendenti da x: α(x) ≤<br />

y ≤ β(x), con α e β funzioni <strong>di</strong> classe C 0 , possiamo definire la funzione<br />

F (x) =<br />

∫ β(x)<br />

α(x)<br />

f(x, y)dy<br />

Proposizione 7.1.4 Se le funzioni f, α e β sono <strong>di</strong> classe C 1 allora anche la funzione F (x) =<br />

∫ β(x)<br />

α(x) f(x, y)dy è <strong>di</strong> classe C1 e vale<br />

∫ β(x)<br />

F ′ (x) = f(x, β(x))β ′ (x) − f(x, α(x))α ′ (x) +<br />

α(x)<br />

Dimostrazione. Ve<strong>di</strong>amo F (x) = F (α(x), β(x), x).<br />

Allora, per la derivazione delle funzioni composte:<br />

F ′ (x) =<br />

∂F<br />

∂α(x) α′ (x) +<br />

∂F<br />

∂β(x) β′ (x) + ∂F<br />

∂x<br />

∂f(x, y)<br />

dy<br />

∂x<br />

Applicando i risultati già visti per ciascuna <strong>di</strong> queste derivate parziali, ritroviamo l’asserto.<br />

✔<br />

7.2 Richiamo sugli integrali semplici<br />

Prima <strong>di</strong> vedere cosa sono gli integrali multipli (doppi o tripli), rive<strong>di</strong>amo brevemente cosa<br />

è un integrale definito <strong>di</strong> una funzione che <strong>di</strong>pende da una sola variabile:<br />

∫ b<br />

a<br />

f(x)dx<br />

1 Possiamo pensare <strong>di</strong> riscrivere la F come F (y 0 , y 1 , x) = R y 1<br />

y f(x, y)dy = − R y 0<br />

0 y f(x, y)dy = −G(y<br />

1<br />

1 , y 0 , x) dove<br />

G(y 1 , y 0 , x) = R y 0<br />

y f(x, y)dy<br />

1<br />

Di G (avendo scambiato il ruolo <strong>di</strong> y 0 e y 1 ) sappiamo qual è la derivata rispetto a y 0 (secondo estremo <strong>di</strong><br />

integrazione):<br />

Allora<br />

∂G<br />

∂y 0<br />

= f(x, y 0 )<br />

∂F (y 0 , y 1 , x)<br />

∂y 0<br />

Ritroviamo dunque l’asserto.<br />

= − ∂G<br />

∂y 0<br />

= −f(x, y 0 )<br />

93


7. INTEGRALI<br />

Figura 7.1:<br />

Come si arriva alla definizione <strong>di</strong> ∫ b<br />

a f(x)dx.<br />

dove a ≤ x ≤ b. Per integrali <strong>di</strong> questo tipo, <strong>di</strong>ciamo che stiamo integrando la funzione f(x)<br />

nell’intervallo [a, b]. I punti a e b si <strong>di</strong>cono estremi dell’intervallo <strong>di</strong> integrazione.<br />

Il concetto <strong>di</strong> integrale <strong>di</strong> una funzione si deriva considerando l’area che si trova sotto la<br />

curva definita da y = f(x) nell’intervallo [a, b] (supponiamo per semplicità che la funzione f<br />

sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi<br />

che negativi... il valore <strong>di</strong> un integrale può essere sia positivo che negativo, a seconda della<br />

funzione da integrare).<br />

Per calcolare l’area sottesa dalla funzione y = f(x) possiamo pensare <strong>di</strong> <strong>di</strong>videre l’intervallo<br />

[a, b] in n parti uguali, in modo da avere n sottointervalli <strong>di</strong> ampiezza ∆x. In ciascuno<br />

<strong>di</strong> questi sottointervalli scegliamo un punto x ∗ i (ad esempio il punto me<strong>di</strong>o <strong>di</strong> ciascuno dei<br />

sottointervalli) e consideriamo il rettangolo <strong>di</strong> ampiezza ∆x e altezza f(x ∗ i ) (si veda Figura<br />

7.1). Ciascuno <strong>di</strong> questi rettangoli ha area pari a f(x ∗ i )∆x, quin<strong>di</strong> l’integrale può essere<br />

approssimato me<strong>di</strong>ante la somma delle aree <strong>di</strong> ciascun rettangolo:<br />

∫ b<br />

a<br />

f(x)dx ≈ f(x ∗ 1)∆x + f(x ∗ 2)∆x + . . . + f(x ∗ n)∆x)<br />

Per ottenere l’area esatta della nostra funzione, facciamo il limite per n che tende<br />

all’infinito.<br />

∫ b<br />

a<br />

f(x)dx = lim<br />

n→∞<br />

i=1<br />

n∑<br />

f(x ∗ i )∆x<br />

7.3 Integrali doppi su domini rettangolari<br />

Ve<strong>di</strong>amo ora cosa accade se abbiamo una funzione <strong>di</strong> due variabili f(x, y). Se per funzioni<br />

<strong>di</strong> una sola variabile integriamo su un intervallo (un sottoinsieme <strong>di</strong> R), per funzioni <strong>di</strong> due<br />

variabili ha senso integrare su una regione <strong>di</strong> R 2 .<br />

Assumiamo <strong>di</strong> avere una regione <strong>di</strong> R 2 data dal rettangolo D = [a, b] × [c, d]. Ciò vuol <strong>di</strong>re<br />

che a ≤ x ≤ b mentre c ≤ y ≤ d.<br />

Sia, inoltre, f(x, y) ≥ 0 per ogni coppia <strong>di</strong> punti (x, y) ∈ D, anche se quanto <strong>di</strong>remo ora si<br />

può estendere al caso più generale <strong>di</strong> funzioni che assumono valori sia positivi che negativi.<br />

La domanda che ci poniamo è la seguente: qual è il volume della regione che si trova<br />

sotto il grafico della funzione f(x, y) e sopra il piano xy (si veda Figura 7.2)<br />

Per prima cosa cerchiamo <strong>di</strong> approssimare il volume (in maniera analoga a quanto abbiamo<br />

fatto per l’area nel caso <strong>di</strong> funzioni <strong>di</strong> una sola variabile). Per far ciò <strong>di</strong>vi<strong>di</strong>amo l’intervallo<br />

[a, b] in n parti uguali e l’intervallo [c, d] in m parti uguali, in modo da <strong>di</strong>videre D in tanti<br />

94


7.3. Integrali doppi su domini rettangolari<br />

Figura 7.2: Grafico <strong>di</strong> una funzione f(x, y) sul rettangolo D.<br />

Figura 7.3:<br />

Sud<strong>di</strong>visione del rettangolo D in tanti rettangolini.<br />

rettangolini (ne abbiamo n × m) e, in ciascuno <strong>di</strong> questi, scegliamo un punto <strong>di</strong> coor<strong>di</strong>nate<br />

(x ∗ i , y∗ j ) (si veda Figura 7.3).<br />

Su ciascuno <strong>di</strong> questi rettangolini, costruiamo una colonnina (un parallelogramma) <strong>di</strong><br />

altezza data da f(x ∗ i , y∗ j ). Ciascuno dei parallelogrammi ha un volume dato da f(x∗ i , y∗ j )∆x∆y.<br />

Approssiamo il volume V che si trova sotto il grafico della funzione f(x, y) sommando i<br />

volumi <strong>di</strong> ciascun parallelogramma<br />

V ≈<br />

n∑<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y<br />

Prendendo sud<strong>di</strong>visioni lungo l’asse x e y via via più raffinate, facendo cioè tendere<br />

all’infinito n e m noi avremo una stima via via più accurata del volume V , vale a <strong>di</strong>re<br />

V =<br />

lim<br />

n∑<br />

n,m→∞<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y<br />

A questo punto abbiamo la definizione <strong>di</strong> integrale doppio (si noti la somiglianza con la<br />

definizione data per integrale definito per funzioni <strong>di</strong> una singola variabile).<br />

95


7. INTEGRALI<br />

In<strong>di</strong>chiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo<br />

D proprio il volume V :<br />

∫∫<br />

D<br />

f(x, y)dA =<br />

lim<br />

7.4 Integrali iterati<br />

n∑<br />

n,m→∞<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y.<br />

Supponiamo che f sia una funzione continua nel rettangolo D = [a, b]×[c, d]. Utilizziamo la<br />

notazione ∫ d<br />

f(x, y)dy per <strong>di</strong>re che x è costante e si integra la funzione rispetto alla variabile y<br />

c<br />

per y che varia da c a d. Una volta che abbiamo calcolato questo integrale, avremo un valore<br />

che <strong>di</strong>pende dal valore <strong>di</strong> x, quin<strong>di</strong> questo integrale definisce una funzione <strong>di</strong> x:<br />

A(x) =<br />

∫ d<br />

c<br />

f(x, y)dy<br />

Adesso integriamo A rispetto a x, per x che varia in [a, b], ottenendo<br />

∫ b ∫ [<br />

b ∫ ]<br />

d<br />

A(x)dx = f(x, y)dy dx<br />

a<br />

a<br />

c<br />

L’integrale scritto a destra dell’equazione precedente prende il nome <strong>di</strong> integrale iterato. Di<br />

solito non si mettono le parentesi ma si scrive <strong>di</strong>rettamente ∫ b ∫ d<br />

f(x, y)dydx: quin<strong>di</strong> prima<br />

a c<br />

integriamo rispetto a y da c a d e poi integriamo rispetto a x da a a b.<br />

Alla stessa maniera si può definire l’integrale iterato dato da<br />

∫ d ∫ b<br />

∫ [<br />

d ∫ ]<br />

b<br />

f(x, y)dxdy = f(x, y)dx dy<br />

c<br />

a<br />

c<br />

a<br />

In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a<br />

y da c a d.<br />

Esempio<br />

Es. 7.4.1 Valutiamo ∫ 4 ∫ 3<br />

0 2 xy2 dydx.<br />

Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo<br />

∫ 3<br />

2<br />

xy 2 dy =<br />

] 3 [x y3<br />

3<br />

2<br />

= x 33<br />

3 − x23 3 = 19 3 x<br />

Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima.<br />

Integriamo questa funzione per x che varia da 0 a 4. Otteniamo<br />

∫ 4 ∫ 3<br />

0<br />

2<br />

xy 2 dydx =<br />

=<br />

∫ 4<br />

0<br />

∫ 4<br />

0<br />

[∫ 3<br />

2<br />

]<br />

xy 2 dy dx<br />

[<br />

19 19<br />

3 xdx = 3<br />

x 2 ] 4<br />

= 19<br />

2<br />

0<br />

3 8 = 152<br />

3<br />

96


7.5. Integrali doppi su domini generali<br />

Esempio<br />

Es. 7.4.2 Proviamo ora a calcolare ∫ 3 ∫ 4<br />

2 0 xy2 dxdy.<br />

Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo<br />

∫ 3 ∫ 4<br />

2<br />

0<br />

xy 2 dxdy =<br />

∫ 3<br />

2<br />

∫ 3<br />

[∫ 4<br />

0<br />

]<br />

xy 2 dx dy<br />

[ ] x<br />

2 4<br />

=<br />

2 2 y2 dy<br />

0<br />

∫ 3<br />

] 3<br />

= 8y 2 dy =<br />

[8 y3<br />

2<br />

3<br />

2<br />

= 8( 33<br />

3 − 23<br />

3 ) = 152<br />

3<br />

Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l’or<strong>di</strong>ne <strong>di</strong><br />

integrazione. Si ha infatti il seguente teorema.<br />

Teorema 7.4.1 (<strong>di</strong> Fubini) Se f(x, y) è una funzione continua su D = [a, b] × [c, d] allora:<br />

o,<br />

∫∫<br />

f(x, y)dA =<br />

∫ b ∫ d<br />

f(x, y)dydx =<br />

∫ d ∫ b<br />

D<br />

a c<br />

c a<br />

∫∫<br />

f(x, y)dA =<br />

∫ b<br />

( ∫ )<br />

d<br />

f(x, y)dy dx =<br />

∫ d<br />

D<br />

a c<br />

c a<br />

f(x, y)dxdy<br />

( ∫ )<br />

b<br />

f(x, y)dx dy<br />

Quin<strong>di</strong> abbiamo due strade equivalenti per calcolare un integrale doppio <strong>di</strong> una funzione<br />

continua su un dominio rettangolare, riconducendoci a integrali <strong>di</strong> una sola variabile che<br />

sappiamo calcolare. Riassumendo:<br />

G nel primo caso<br />

∫∫<br />

∫ b ∫ d<br />

∫ (<br />

b ∫ )<br />

d<br />

f(x, y)dA = f(x, y)dydx = f(x, y)dy dx<br />

D<br />

a<br />

c<br />

a<br />

noi prima calcoliamo l’integrale che sta all’interno (tra parentesi tonde), vale a <strong>di</strong>re,<br />

∫ d<br />

f(x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Come<br />

risultato avremo una funzione che <strong>di</strong>pende solo da x e sarà questa che poi andremo<br />

c<br />

a integrare tra a e b rispetto alla variabile x;<br />

G nel secondo caso<br />

∫∫<br />

∫ d ∫ b<br />

∫ (<br />

d ∫ )<br />

b<br />

f(x, y)dA = f(x, y)dxdy = f(x, y)dx dy<br />

D<br />

c<br />

a<br />

c<br />

an<strong>di</strong>amo prima a calcolare l’integrale ∫ b<br />

f(x, y)dx rispetto a x, considerando y come una<br />

a<br />

costante e poi andremo a integrare il risultato ottenuto rispetto a y nell’intervallo [c, d].<br />

7.5 Integrali doppi su domini generali<br />

A <strong>di</strong>fferenza <strong>degli</strong> integrali <strong>di</strong> funzioni <strong>di</strong> una sola variabile, in cui il dominio <strong>di</strong> integrazione<br />

è sempre un intervallo, per integrali <strong>di</strong> funzioni <strong>di</strong> due variabili, il dominio <strong>di</strong> integrazione<br />

c<br />

a<br />

97


7. INTEGRALI<br />

Figura 7.4:<br />

Dominio normale rispetto all’asse x (sinistra) e rispetto all’asse y (destra).<br />

non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso<br />

in cui il dominio <strong>di</strong> integrazione sia un insieme limitato D (perciò esiste un rettangolo R che<br />

lo contiene).<br />

In tal caso l’integrale <strong>di</strong> una funzione f(x, y) sul dominio R si può ricondurre all’integrale<br />

<strong>di</strong> una funzione F (x, y) sul rettangolo R così definita:<br />

{<br />

f(x, y) se (x, y) appartiene a D<br />

F (x, y) =<br />

0 se (x, y) appartiene a R ma non a D<br />

Allora<br />

∫∫<br />

D<br />

∫∫<br />

f(x, y)dA =<br />

R<br />

F (x, y)dA<br />

Da un punto <strong>di</strong> vista pratico, come calcolare questo integrale La frontiera dell’insieme<br />

D deve potersi esprimere me<strong>di</strong>ante funzioni continue <strong>di</strong> x o <strong>di</strong> y. Ci sono due casi da<br />

considerare (si vedano Figure 7.4 e 7.5 per <strong>degli</strong> esempi)<br />

1. Caso 1: l’insieme D è dato da<br />

{<br />

}<br />

D = (x, y) ∈ R 2 t. c. a ≤ x ≤ b, g 1 (x) ≤ y ≤ g 2 (x)<br />

Si <strong>di</strong>ce che il dominio è normale rispetto all’asse x.<br />

2. Caso 2: l’insieme D è dato da<br />

{<br />

}<br />

D = (x, y) ∈ R 2 t. c. h 1 (y) ≤ x ≤ h 2 (y), c ≤ y ≤ d<br />

Si <strong>di</strong>ce che il dominio è normale rispetto all’asse y.<br />

Se il dominio è normale rispetto all’asse x, vuol <strong>di</strong>re che prendendo una retta x = x 0<br />

con a ≤ x 0 ≤ b, (normale dunque all’asse x), i valori <strong>di</strong> y che sono compresi tra g 1 (x 0 ) e<br />

g 2 (x 0 ) giacciono tutti all’interno del dominio <strong>di</strong> integrazione. Analogamente, nel caso in cui<br />

il dominio sia normale rispetto all’asse y, prendendo la retta y = y 0 normale all’asse y, con<br />

c ≤ y 0 ≤ d, si ha che tutti i punti <strong>di</strong> or<strong>di</strong>nata y 0 e <strong>di</strong> ascissa compresa tra h 1 (y 0 ) e h 2 (y 0 ) sono<br />

all’interno del dominio <strong>di</strong> integrazione.<br />

In questi casi, il teorema <strong>di</strong> Fubini applicato al rettangolo R in cui uno dei due lati<br />

corrisponde con l’intervallo [a, b] o [c, d] a seconda che il dominio sia normale rispetto all’asse<br />

x o y, si riduce ad un integrale iterato in cui gli estremi dell’integrale interno (da calcolare<br />

per primo) sono dati proprio dalle due funzioni g 1 , g 2 , o h 1 , h 2 che delimitano la frontiera <strong>di</strong><br />

D, in quanto all’esterno la funzione F è nulla. Si ha il seguente teorema.<br />

Teorema 7.5.1 (<strong>di</strong> Fubini) Data una funzione f(x, y) da integrare su un dominio D,<br />

98


7.5. Integrali doppi su domini generali<br />

}<br />

Figura 7.5: A sinitra: D =<br />

{(x, y) ∈ R 2 : 1 ≤ y ≤ 2, y ≤ x ≤ y 3 . Il dominio è normale rispetto<br />

{<br />

all’asse y. A destra: D = (x, y) ∈ R 2 : 0 ≤ x ≤ 1, x 3 ≤ y ≤ √ }<br />

x . Il dominio è normale rispetto<br />

all’asse x.<br />

Figura 7.6: Dominio dato dal triangolo <strong>di</strong> vertici (0, 3), (1, 1) e (5, 3)<br />

G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse x (Caso 1) si ha:<br />

∫∫<br />

∫ b ∫ g2(x)<br />

f(x, y)dA = f(x, y)dydx<br />

D<br />

a<br />

g 1(x)<br />

G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse y (Caso 2) si ha:<br />

∫∫<br />

∫ d ∫ h2(y)<br />

f(x, y)dA =<br />

f(x, y)dxdy<br />

D<br />

c<br />

h 1(y)<br />

Esaminiamo il Caso 1 (il <strong>di</strong>scorso si ripete analogo per il Caso 2). Noi calcoliamo prima<br />

l’integrale interno ∫ g 2(x)<br />

g 1(x)<br />

f(x, y)dy considerando x come costante, rispetto alla variabile y. Il<br />

risultato ora <strong>di</strong>pende da x in quanto gli estremi <strong>di</strong> integrazione sono funzioni <strong>di</strong> x. Una volta<br />

ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b.<br />

A volte, un dominio può essere considerato normale sia rispetto all’asse x sia rispetto<br />

all’asse y. Altre volte può essere visto come unione <strong>di</strong> due domini. A seconda dell’integrale<br />

che si deve fare, conviene scegliere <strong>di</strong> vederlo in un modo piuttosto che in un altro.<br />

99


7. INTEGRALI<br />

Esempio<br />

Es. 7.5.1 Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto come<br />

l’unione <strong>di</strong> due domini normali rispetto all’asse x, oppure come un dominio normale<br />

rispetto all’asse y.<br />

Nel primo caso, D = D 1 ∪ D 2 , in quanto la funzione g 1 (x) varia a seconda <strong>di</strong> dove si trovi<br />

x:<br />

D 1 = {(x, y) t.c. 0 ≤ x ≤ 1, −2x + 3 ≤ y ≤ 3}<br />

{<br />

1<br />

D 2 = (x, y) t.c. 1 ≤ x ≤ 5,<br />

2 x + 1 }<br />

2 ≤ y ≤ 3<br />

Se riscriviamo le equazioni delle due rette y = −2x + 3 e y = 1 2 x + 1 2<br />

in funzione <strong>di</strong> x<br />

otteniamo, dalla prima, x = − 1 2 y + 3 , e dalla seconda x = 2y − 1, e possiamo scrivere<br />

2<br />

l’insieme D come<br />

D =<br />

{(x, y) t.c. − 1 2 y + 3 }<br />

2 ≤ x ≤ 2y − 1, 1 ≤ y ≤ 3<br />

Esempio<br />

Es. 7.5.2 Calcoliamo ∫∫ D x2 dA dove D è l’insieme delimitato dalle parabole y = 3x 2 e<br />

y = x 2 + 2. Prima <strong>di</strong> tutta facciamo un grafico dell’insieme D (si veda Figura 7.7). I punti<br />

<strong>di</strong> intersezione delle due parabole si hanno per 3x 2 = x 2 + 2 cioè 2x 2 − 2 = vale a <strong>di</strong>re per<br />

x = ±1. Si vede facilmente che il dominio è normale rispetto all’asse x: basta considerare<br />

−1 ≤ x ≤ 1 e 3x 2 ≤ y ≤ x 2 + 2. Infatti la curva che delimita la porzione inferiore della<br />

frontiera dell’insieme è data da y = 3x 2 mentre la porzione superiore della frontiera è<br />

y = x 2 + 2. L’integrale <strong>di</strong>venta<br />

∫∫<br />

D<br />

x 2 ydA =<br />

=<br />

=<br />

=<br />

∫ 1 ∫ x 2 +2<br />

−1<br />

∫ 1<br />

−1<br />

∫ 1<br />

−1<br />

∫ 1<br />

−1<br />

3x 2<br />

x 2 dydx<br />

[<br />

x 2 y ] y=x 2 +2<br />

y=3x 2<br />

x 2 (x 2 + 2 − 3x 2 )dx<br />

2x 2 − 2x 4 dx =<br />

] 1 [2 x3<br />

3 − 2x5 = 2 2 5<br />

−1<br />

3 − 22 5 = 8 15<br />

Esempio<br />

Es. 7.5.3 Sia da calcolare l’integrale ∫ 1 ∫ 1<br />

0 y sin x2 dxdy. Se cerchiamo <strong>di</strong> valutare l’integrale<br />

così come ci è stato presentato, abbiamo la <strong>di</strong>fficoltà <strong>di</strong> dover valutare ∫ sin x 2 dx.<br />

Si tratta, infatti, <strong>di</strong> uno <strong>di</strong> quegli integrali impossibili da valutare me<strong>di</strong>ante funzioni elementari!<br />

Ci conviene allora cambiare l’or<strong>di</strong>ne <strong>di</strong> integrazione. Cerchiamo allora <strong>di</strong> capire<br />

come { è fatto il dominio <strong>di</strong> integrazione } D. Da come è scritto l’integrale, risulta<br />

D = (x, y) ∈ R 2 : 0 ≤ y ≤ 1, y ≤ x ≤ 1 . Facciamo il grafico (si veda Figura 7.8). Questo<br />

dominio lo possiamo vedere come normale rispetto all’asse x prendendo 0 ≤ x ≤ 1 e<br />

0 ≤ y ≤ x.<br />

100


7.6. Proprietà <strong>degli</strong> integrali doppi<br />

Figura 7.7: Dominio <strong>di</strong> integrazione delimitato dalle parabole y = 3x 2 e y = x ∗ 2 + 2.<br />

Figura 7.8: Dominio <strong>di</strong> integrazione dell’integrale ∫ 1 ∫ 1<br />

0 y sin x2 dxdy.<br />

Quin<strong>di</strong><br />

∫ 1 ∫ 1<br />

0<br />

y<br />

∫∫<br />

sin x 2 dxdy =<br />

=<br />

=<br />

= 1 2<br />

D<br />

∫ 1 ∫ x<br />

0<br />

∫ 1<br />

sin x 2 dA<br />

0<br />

0<br />

∫ 1<br />

sin x 2 dydx =<br />

x sin x 2 dx = 1 2<br />

0<br />

∫ 1<br />

0<br />

∫ 1<br />

d(x 2 )<br />

dx sin x2 dx = 1 2<br />

0<br />

[<br />

y sin x<br />

2 ] y=x<br />

y=0 dx<br />

2x sin x 2 dx<br />

[<br />

− cos x<br />

2 ] 1<br />

0 = 1 (1 − cos 1)<br />

2<br />

7.6 Proprietà <strong>degli</strong> integrali doppi<br />

Assumendo che i seguenti integrali esistano, ve<strong>di</strong>amone brevemente alcune proprietà:<br />

G ∫∫ D (f(x, y) + g(x, y)) dA = ∫∫ D f(x, y)dA + ∫∫ D g(x, y)dA 101


7. INTEGRALI<br />

Figura 7.9: Esempio <strong>di</strong> trasformazione globalmente invertibile dall’insieme S del piano uv<br />

all’insieme R del piano xy.<br />

G ∫∫ D cf(x, y)dA = c ∫∫ f(x, y)dA, essendo c una costante.<br />

D<br />

G Se f(x, y) ≥ g(x, y) per tutti i punti (x, y) in D, allora ∫∫ D f(x, y)dA ≥ ∫∫ g(x, y)dA.<br />

D<br />

G Se D = D 1 ∪ D 2 , dove D 1 e D 2 sono domini che non si sovrappongono ma possono avere<br />

al più solo punti della frontiera in comune, allora<br />

∫∫<br />

f(x, y)dA =<br />

D<br />

∫∫<br />

f(x, y)dA +<br />

D 1<br />

∫∫<br />

f(x, y)dA<br />

D 2<br />

G Considerando la funzione <strong>di</strong> valore costante 1 si ha<br />

∫∫<br />

1dA = area(D)<br />

D<br />

dove area(D) è l’area dell’insieme D (torneremo su questo punto più avanti).<br />

G Se m ≤ f(x, y) ≤ M per tutti i punti (x, y) in D, allora<br />

∫∫<br />

m area(D) ≤ f(x, y)dA ≤ M area(D)<br />

7.7 Cambiamento <strong>di</strong> variabili<br />

D<br />

A volte, il calcolo <strong>di</strong> un integrale si può semplificare operando un cambiamento <strong>di</strong> variabili.<br />

A tale scopo, per il calcolo <strong>di</strong> integrali doppi, consideriamo un cambiamento <strong>di</strong><br />

variabili dato da una trasformazione T che permette <strong>di</strong> passare dal piano uv al piano xy:<br />

T (u, v) = (x, y) dove x e y sono legate a u e v me<strong>di</strong>ante equazioni del tipo<br />

x = x(u, v), y = y(u, v)<br />

Questa trasformazione può essere vista come una funzione vettoriale ⃗r = (x(u, v), y(u, v)).<br />

L’ipotesi fondamentale, allo scopo <strong>di</strong> calcolare un integrale doppio, è che la trasformazione<br />

ci permetta <strong>di</strong> ottenere tutti i punti del dominio <strong>di</strong> integrazione.<br />

Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono<br />

sottoinsiemi <strong>di</strong> R 2 . Se T (u 1 , v 1 ) = (x 1 , y 1 ) allora il punto (x 1 , y 1 ) è l’immagine del punto (u 1 , v 1 )<br />

me<strong>di</strong>ante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l’insieme<br />

<strong>di</strong> definizione e il codominio della trasformazione, allora si può definire la trasformazione<br />

inversa T −1 e si <strong>di</strong>ce che la trasformazione è globalmente invertibile (si veda Figura 7.9).<br />

Definizione 7.7.1 Una trasformazione x = x(u, v) y = y(u, v) definita in un insieme aperto <strong>di</strong><br />

R 2 si <strong>di</strong>ce regolare se<br />

1. è <strong>di</strong> classe C 1<br />

2. è globalmente invertibile<br />

102


7.7. Cambiamento <strong>di</strong> variabili<br />

Figura 7.10: Trasformazione dell’elemento S nel piano uv nell’elemento R nel piano xy.<br />

3. in ogni punto (u, v) lo jacobiano risulta <strong>di</strong>verso da zero 2<br />

∣ ∣∣∣∣∣∣∣∣ ∂x<br />

∂(x, y)<br />

∣∂(u, v) ∣ = ∂u<br />

∂y<br />

∂u<br />

∂x<br />

∂v<br />

= ∂x ∂y<br />

∂y<br />

∂u ∂v − ∂y ∂x<br />

∂u ∂v ≠ 0<br />

∣<br />

∂v<br />

Un esempio <strong>di</strong> trasformazione regolare è dato dalle coor<strong>di</strong>nate polari<br />

x = x(ρ, θ) = ρ cos (θ) y = y(ρ, θ) = ρ sin (θ) con ρ > 0 e 0 ≤ θ ≤ 2π.<br />

Cerchiamo <strong>di</strong> capire, ora, come un cambiamento <strong>di</strong> variabili agisca sul calcolo <strong>di</strong> un<br />

integrale doppio. Ricor<strong>di</strong>amo che, nel caso <strong>di</strong> un integrale <strong>di</strong> una funzione scalare il cambiamento<br />

<strong>di</strong> variabile porta alla tecnica della sostituzione: data una funzione f(x) da integrare<br />

in [a, b] si ha<br />

∫ b<br />

a<br />

f(x)dx =<br />

∫ d<br />

c<br />

f(g(u))g ′ (u)du<br />

dove x = g(u), a = g(c), b = g(d). Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, cosa si fa e per quale<br />

motivo<br />

7.7.1 Significato dello jacobiano<br />

Consideriamo un rettangolino S nel piano uv il cui angolo in basso a sinistra è dato dal<br />

punto (u 0 , v 0 ), e <strong>di</strong> <strong>di</strong>mensioni ∆u e ∆v. L’immagine della regione S attraverso la trasformazione<br />

regolare T sia la regione R del piano xy. Uno dei punti della frontiera sia proprio<br />

l’immagine del punto (u 0 , v 0 ), cioè (x 0 , y 0 ) = T (u 0 , v 0 ). Si veda la Figura 7.10.<br />

La trasformazione T sia data me<strong>di</strong>ante due equazioni parametriche del tipo x = x(u, v) e<br />

y = y(u, v) che possiamo vedere come una funzione vettoriale ⃗r(u, v) = (x(u, v), y(u, v)). Il lato<br />

del rettangolino <strong>di</strong> S che si ha per v = v 0 viene trasformato in R me<strong>di</strong>ante la curva ⃗r(u, v 0 )<br />

(che <strong>di</strong>pende ora solo dal parametro u). Di questa curva il vettore tangente in u = u 0 (quin<strong>di</strong><br />

al punto (x 0 , y 0 )) è dato da ⃗r tu = ( ∂x(u 0, v 0 )<br />

, ∂y(u 0, v 0 )<br />

).<br />

∂u ∂u<br />

Alla stessa maniera, troviamo che il vettore tangente alla curva ⃗r(u 0 , v) nel punto v = v 0 è<br />

dato da ⃗r tv = ( ∂x(u 0, v 0 )<br />

, ∂y(u 0, v 0 )<br />

).<br />

∂v ∂v<br />

2 Si rimanda alla definizione 4.7.1 per ricordare cosa è lo jacobiano.<br />

103


7. INTEGRALI<br />

Figura 7.11: Approssimazione <strong>di</strong> R me<strong>di</strong>ante i vettori secanti.<br />

La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti<br />

(si veda Figura 7.11) dati da<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 )<br />

Ricordando che ∂⃗r(u 0, v 0 )<br />

⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 )<br />

= lim ∆u→0 , e ricordando che la derivata<br />

∂u<br />

∆u<br />

parziale <strong>di</strong> una funzione vettoriale è data dalle derivate parziali delle singole componenti<br />

della funzione vettoriale, ricaviamo l’approssimazione<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u ∂⃗r<br />

∂u<br />

ma, per quanto detto prima, ∂⃗r<br />

∂u = ⃗r tu, da cui<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u⃗r tu .<br />

Con analogo ragionamento arriviamo all’approssimazione<br />

⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 ) ≈ ∆v⃗r tv .<br />

Quin<strong>di</strong> l’area della regione R può essere approssimata attraverso dall’area del parallelogramma<br />

<strong>di</strong> lati ⃗a e ⃗ b cioè ∆u⃗r tu e ∆v⃗r tv . L’area del parallelogramma determinato da due vettori<br />

è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quin<strong>di</strong> l’area <strong>di</strong> R si può<br />

approssimare tramite |(∆u⃗r tu ) × (∆v⃗r tv )|. Si ha, quin<strong>di</strong>,<br />

area(R) ≈ |⃗a × ⃗ b| = |(∆u⃗r tu ) × (∆v⃗r tv )| = |⃗r tu × ⃗r tv |∆u∆v<br />

Calcoliamo il prodotto vettoriale<br />

⃗i ⃗j ⃗ k<br />

∂x ∂y<br />

⃗r tu × ⃗r tv =<br />

∂u ∂u 0<br />

∂x ∂y<br />

∣ 0∣<br />

∂v ∂v<br />

I sottodeterminanti delle componenti rispetto a x e a y sono nulli, da cui<br />

∂x ∂y<br />

⃗r tu × ⃗r tv = ⃗ ∂u ∂u<br />

k<br />

= ∂x ∂y<br />

⃗ k( ∂x ∂y<br />

∂u ∂v − ∂x ∂y<br />

∂v ∂u )<br />

∣ ∣<br />

∂v ∂v<br />

104


7.7. Cambiamento <strong>di</strong> variabili<br />

Figura 7.12: Cambio <strong>di</strong> variabili per il calcolo <strong>di</strong> integrali doppi: trasformazione della regione<br />

S nella regione R me<strong>di</strong>ante la trasformazione regolare T .<br />

Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v:<br />

∂(x, y)<br />

∣∂(u, v) ∣ . Perciò, area(R) ≈<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v.<br />

∫∫ Supponiamo, ora, <strong>di</strong> dover calcolare l’integrale <strong>di</strong> una funzione f(x, y) su un dominio R<br />

f(x, y)dA. Sia data una trasformazione regolare che trasforma un insieme S del piano uv<br />

R<br />

nella regione R. Sud<strong>di</strong>vi<strong>di</strong>amo il dominio R in elementini R ij , ciascuno dei quali è immagine<br />

<strong>di</strong> un rettangolino S ij <strong>di</strong> S. Su ciascuno <strong>di</strong> questi elementini R ij consideriamo un punto <strong>di</strong><br />

coor<strong>di</strong>nate (x i , y j ) che è immagine, me<strong>di</strong>ante la trasformazione T , del punto (u i , v j ) che si<br />

trova sull’angolo in basso a sinistra del rettangolino S ij (si veda la Figura 7.12). Allora l’area<br />

∆R ij può essere approssimata me<strong>di</strong>ante la relazione<br />

∆R ij ≈<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v<br />

dove ∆u e ∆v sono i lati del rettangolino S ij , mentre lo jacobiano è valutato in (u i , v j ). Allora<br />

∫∫<br />

m∑ n∑<br />

f(x, y)dA ≈ f(x i , y j )∆R ij<br />

R<br />

≈<br />

i=1 j=1<br />

m∑<br />

i=1 j=1<br />

n∑<br />

f(x(u i , v j ), y(u i , v j ))<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v<br />

A questo punto osserviamo che<br />

m∑ n∑<br />

∫∫<br />

f(x(u i , v j ), y(u i , v j ))<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v ≈<br />

i=1 j=1<br />

S<br />

f(x(u, v), y(u, v)<br />

∂(x, y)<br />

∣∂(u, v) ∣ dudv<br />

Si arriva perciò al seguente teorema (che non <strong>di</strong>mostriamo, però tutti i <strong>di</strong>scorsi appena<br />

fatti ci portano a intuire che il risultato non può che essere così!).<br />

Teorema 7.7.1 Sia data una trasformazione regolare T della regione S del piano uv alla regione<br />

R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le<br />

regioni R e S siano domini normali rispetto all’asse x o y. Allora<br />

∫∫<br />

∫∫<br />

f(x, y)dA = f(x(u, v), y(u, v)<br />

∂(x, y)<br />

∣<br />

∣∂(u, v)<br />

R<br />

S<br />

∣ dudv 105


7. INTEGRALI<br />

Figura 7.13: Aree corrispondenti nel piano θρ e nel piano xy.<br />

Figura 7.14: Insiemi S e R per il calcolo dell’integrale ∫∫ 4x + 8ydA.<br />

R<br />

Esempio<br />

Es. 7.7.1 Consideriamo il caso della trasformazione data dalle coor<strong>di</strong>nate polari, per cui<br />

x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ).<br />

Il rettangolino ∆θ∆ρ viene trasformato in una specie <strong>di</strong> rettangolino con i lati curvi.<br />

Il <strong>di</strong>segno mostrato in figura 7.13 è stato realizzato facendo variare θ nell’intervallino<br />

[ 2π 3 , 2π + 0.5] e ρ in [0.5, 0.75].<br />

3<br />

Lo jacobiano <strong>di</strong> questa trasformazione è dato da<br />

∣ ∂(x, y)<br />

∣∣∣ ∣ ∂(ρ, θ) ∣ = cos (θ) −ρ sin (θ)<br />

sin (θ) ρ cos (θ) ∣ = ρ cos2 (θ) + ρ sin 2 (θ) = ρ<br />

Perciò, se facciamo un cambiamento <strong>di</strong> variabili utilizzando coor<strong>di</strong>nate polari si ha:<br />

∫∫<br />

∫∫<br />

f(x, y)dA = f(ρ cos (θ), ρ sin (θ))ρ dρdθ<br />

R<br />

S<br />

106


7.8. Area <strong>di</strong> un dominio<br />

Esempio<br />

Es. 7.7.2 Sia da calcolare ∫∫ 4x + 8ydA dove R è il parallelogramma <strong>di</strong> vertici A(−1, 3),<br />

R<br />

B(1, −3), C(3, −1) e D(1, 5). Si applichi la trasformazione x = 1 4 (u + v), y = 1 (v − 4u).<br />

4<br />

Il parallelogramma R è rappresentato in Figura 7.14. Se scriviamo le equazioni dei lati del<br />

parallelogramma si trova facilmente che la retta per AB è data dall’equazione y + 3x = 0,<br />

la retta per CD è data da y + 3x = 8, la retta per BC è x − y = 4 e infine quella per AD è<br />

x − y = −4.<br />

Da queste relazioni, si vede che ponendo u = x−y e v = y +3x, si ricava la trasformazione<br />

assegnata x = 1 4 (u + v), y = 1 (v − 4u). Inoltre si vede che R è l’immagine del rettangolo S<br />

4<br />

delimitato dalle linee u = 4, u = −4, v = 0 e v = 8.<br />

Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo<br />

Allora<br />

∫∫<br />

∣ ∣∣∣∣∣∣∣ 1<br />

∂(x, y)<br />

∣∂(u, v) ∣ = 4<br />

1<br />

4<br />

R<br />

−3<br />

4<br />

1<br />

4<br />

∫∫<br />

4x + 8ydA =<br />

= 1 4<br />

= 1 4<br />

= 1 4<br />

∣<br />

(4 1 4 (u + v) + 81 4 (v − 3u) ) 1<br />

4 dudv = ∫∫<br />

S<br />

∫ 4 ∫ 8<br />

−4<br />

∫ 4<br />

0<br />

(3v − 5u)dvdu = 1 4<br />

−4(96 − 40u)du = 1 4<br />

∫ 4<br />

−4<br />

S<br />

[ 3<br />

2 v2 − 5uv] v=8<br />

[<br />

96u − 20u<br />

2 ] u=4<br />

u=−4 = 192<br />

(u + v + 2v − 6u) 1 4 dudv<br />

du<br />

v=0<br />

7.8 Area <strong>di</strong> un dominio<br />

Dagli integrali doppi si può ricavare un’altra considerazione geometrica, sull’area del<br />

dominio <strong>di</strong> integrazione. Come abbiamo già visto tra le proprietà <strong>degli</strong> integrali doppi, si ha<br />

∫∫<br />

area(D) = dA<br />

D<br />

Proviamo a <strong>di</strong>mostrare questo risultato, supponendo che D sia un dominio normale rispetto<br />

all’asse x, da cui a ≤ x ≤ b e g 1 (x) ≤ y ≤ g 2 (y). L’area compresa tra le curve g 2 (x) e<br />

g 1 (x), vale a <strong>di</strong>re l’area <strong>di</strong> D, può essere calcolata proprio come la <strong>di</strong>fferenze <strong>degli</strong> integrali<br />

delle due funzioni, tramite l’integrale<br />

area(D) =<br />

∫ b<br />

a<br />

(g 2 (x) − g 1 (x))dx<br />

D’altra parte, dalla definizione <strong>di</strong> integrale doppio, considerando la funzione f(x, y) = 1,<br />

107


7. INTEGRALI<br />

Figura 7.15: Area <strong>di</strong> D come integrale doppio<br />

abbiamo<br />

∫∫<br />

D<br />

dxdy =<br />

=<br />

∫ b ∫ g2(x)<br />

a<br />

∫ b<br />

a<br />

(<br />

g 1(x)<br />

dy)dx<br />

(g 2 (x) − g 1 (x))dx<br />

e, per quanto abbiamo appena visto<br />

= area(D)<br />

7.9 Cenni su integrali tripli<br />

L’estensione del concetto <strong>di</strong> integrale <strong>di</strong> una funzione <strong>di</strong>pendente da due variabili ad una<br />

funzione <strong>di</strong>pendente da tre variabili porta al cosiddetto integrale triplo: ∫∫∫ f(x, y, z)dV .<br />

E<br />

Il caso più semplice si ha quando il dominio <strong>di</strong> integrazione E è rappresentato da un<br />

parallelepipedo [a, b] × [c, d] × [r, s].<br />

Allora si ha:<br />

∫∫∫<br />

∫ s ∫ d ∫ b<br />

f(x, y, z)dV =<br />

f(x, y, z)dxdydz<br />

E<br />

=<br />

=<br />

= .<br />

r c a<br />

∫ b ∫ d ∫ s<br />

a c r<br />

∫ d ∫ s ∫ b<br />

c<br />

r<br />

a<br />

f(x, y, z)dzdydx<br />

f(x, y, z)dxdzdy<br />

Abbiamo 6 <strong>di</strong>verse possibilità <strong>di</strong> integrazione, prima rispetto a x, poi rispetto a y, poi rispetto<br />

a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando<br />

l’or<strong>di</strong>ne delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l’integrale <strong>di</strong><br />

funzioni continue, in modo da estendere il teorema <strong>di</strong> Fubini).<br />

108


7.10. Integrali curvilinei<br />

Si ha, inoltre, che il volume <strong>di</strong> una regione tri<strong>di</strong>mensionale E è dato da un integrale triplo<br />

e, precisamente<br />

∫∫∫<br />

volume(E) = dV<br />

E<br />

Se la regione <strong>di</strong> integrazione E è più generale, le tecniche <strong>di</strong> integrazione sono estese su<br />

tre possibili tipi <strong>di</strong> dominio:<br />

1. Primo caso: E = {(x, y, z) t.c. (x, y) ∈ D, u 1 (x, y) ≤ z ≤ u 2 (x, y)}, dove D è un regione nel<br />

piano xy (che a sua volta può essere visto come un dominio normale rispetto all’asse x o<br />

rispetto all’asse y). La regione E viene detta normale rispetto al piano xy e l’integrazione<br />

per fili.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(x,y)<br />

f(x, y, z)dV =<br />

f(x, y, z)dz dA<br />

E<br />

D<br />

u 1(x,y)<br />

2. Secondo caso: E = {(x, y, z) t.c. (y, z) ∈ D, u 1 (y, z) ≤ x ≤ u 2 (y, z)}, dove D è un regione<br />

nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />

y o rispetto all’asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce<br />

a vedere l’insieme D come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione per<br />

strati o per sezione.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(y,z)<br />

f(x, y, z)dV =<br />

f(x, y, z)dx dA<br />

E<br />

D<br />

u 1(y,z)<br />

3. Secondo caso: E = {(x, y, z) t.c. (x, z) ∈ D, u 1 (x, z) ≤ y ≤ u 2 (x, z)}, dove D è un regione<br />

nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />

x o rispetto all’asse z). La regione E viene detta normale rispetto al piano xz. Se l’insieme<br />

D lo si può vedere come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione<br />

per strati o per sezione.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(x,z)<br />

f(x, y, z)dV =<br />

f(x, y, z)dy dA<br />

E<br />

7.10 Integrali curvilinei<br />

D<br />

u 1(x,z)<br />

Un integrale curvilineo (o <strong>di</strong> linea) ha lo scopo <strong>di</strong> integrare una funzione <strong>di</strong> due (o tre)<br />

variabili su un insieme <strong>di</strong> integrazione dato da una curva γ.<br />

Ci soffermiamo al caso bi<strong>di</strong>mensionale (quin<strong>di</strong> funzioni <strong>di</strong> due variabili e curve nel piano<br />

xy).<br />

Consideriamo una curva γ regolare (la funzione vettoriale f che la rappresenta è continua<br />

e la sua derivata è <strong>di</strong>versa da zero per ogni valore del parametro t.) Quin<strong>di</strong> f(t) = (x(t), y(t))<br />

con a ≤ t ≤ b.<br />

∫ L’integrale curvilineo <strong>di</strong> una funzione g(x, y) lungo la curva γ si denota con il simbolo<br />

g(x, y)ds dove ds rappresenta il <strong>di</strong>fferenziale dell’ascissa curvilinea, dovuto al fatto che ci<br />

γ<br />

stiamo muovendo lungo la curva e<br />

√<br />

non su l’asse delle x o delle y.<br />

(dx ) 2 ( ) 2 dy<br />

Ricor<strong>di</strong>amo che ds = |f ′ (t)|dt = + dt<br />

dt dt<br />

Allora, andando a sostituire nell’integrale curvilineo e considerando la curva scritta in<br />

forma parametrica si ha:<br />

√<br />

∫<br />

∫ b<br />

(dx ) 2 ( ) 2 dy<br />

g(x, y)ds = g(x(t), y(t)) + dt<br />

dt dt<br />

γ<br />

a<br />

109


7. INTEGRALI<br />

Per g(x, y) = 1 si ottiene la lunghezza della curva.<br />

Esempio<br />

Es. 7.10.1 Vogliamo calcolare ∫ γ (4+xy2 )ds dove γ è la porzione <strong>di</strong> circonferenza <strong>di</strong> centro<br />

nell’origine e raggio unitario che si ha −1 ≤ x ≤ 0.<br />

Scriviamo le equazioni parametriche della curva γ:<br />

x = cos t, y = sin t,<br />

L’integrale da calcolare <strong>di</strong>venta<br />

∫<br />

γ<br />

(4 + xy 3 )ds =<br />

=<br />

∫ 3π/2<br />

π/2<br />

∫ 3π/2<br />

π/2<br />

π<br />

2 ≤ t ≤ 3 2 π<br />

√<br />

(4 + cos t sin 2 t) sin 2 t + cos 2 tdt<br />

(4 + D(sin t) sin 2 t)dt =<br />

[ ] 3π/2<br />

4t + sin3 t<br />

= 4π − 2 3<br />

π/2<br />

3<br />

Se la curva è regolare a tratti, l’integrale curvilineo si scrive come somma <strong>degli</strong> integrali<br />

curvilinei su ciascun tratto <strong>di</strong> curva regolare <strong>di</strong> cui è composta. In pratica se γ = γ 1 ∪γ 2 . . .∪γ n<br />

con n numero intero, allora<br />

∫<br />

g(x, y)ds =<br />

γ<br />

∫<br />

g(x, y)ds +<br />

γ 1<br />

∫<br />

g(x, y)ds + . . . +<br />

γ 2<br />

∫<br />

g(x, y)ds.<br />

γ n<br />

Ogni curva ha un suo orientamento.<br />

cambia l’integrale curvilineo<br />

Se cambiamo la <strong>di</strong>rezione <strong>di</strong> moto della curva,<br />

Proposizione 7.10.1 Se si cambia l’orientamento <strong>di</strong> una curva, passando dalla curva +γ alla<br />

curva −γ l’integrale curvilineo non cambia:<br />

∫<br />

∫<br />

g(x, y)ds = g(x, y)ds<br />

γ<br />

−γ<br />

Se +γ è data dalle equazioni parametriche (x(t), y(t)) con a ≤ t ≤ b, (primo punto A =<br />

(x(a), y(a)), ultimo punto B = (x(b), y(b))), la curva −γ ha equazioni (x(−t), y(−t)) con t che<br />

varia in [−b, −a], (primo punto (x(b), y(b)) = B, ultimo punto (x(a), y(a)) = A). Le curve sono le<br />

stesse a parte l’orientamento, ma questo non influisce sul risultato dell’integrale curvilineo.<br />

7.11 Integrali <strong>di</strong> superficie<br />

Cerchiamo ora <strong>di</strong> integrare una funzione su una superficie S nello spazio tri<strong>di</strong>mensionale.<br />

7.11.1 Area <strong>di</strong> una superficie<br />

Per capire le formule che scriveremo nel seguito, deriviamo la formula che permette<br />

<strong>di</strong> calcolare l’area <strong>di</strong> una superficie data da equazioni parametriche x = x(u, v), y =<br />

y(u, v), z = z(u, v), equazioni che possiamo scrivere tramite la funzione vettoriale ⃗r(u, v) =<br />

(x(u, v), y(u, v), z(u, v)).<br />

Con un <strong>di</strong>scorso del tutto simile a quanto abbiamo visto nella sezione 7.7 sul cambiamento<br />

<strong>di</strong> variabile, chiamando però adesso D come l’insieme in cui varia (u, v) e S la superficie parametrica,<br />

sud<strong>di</strong>videndo D in rettangolini D ij , in S si hanno i corrispondenti elementini S ij .<br />

Inoltre, se (u i , v j ) è il vertice in basso a sinistra <strong>di</strong> D ij , il punto P ij (x(u i , v j ), y(u i , v j ), z(u i , v j ))<br />

è il corrispondente punto su S ij . L’area dell’elementino S ij può essere approssimata me<strong>di</strong>ante<br />

il parallelogramma <strong>di</strong> lati ∆u⃗r u (u i , v j ) e ∆v⃗r v (u i , v j ) dove ⃗r u e ⃗r v rappresentano la<br />

110


7.11. Integrali <strong>di</strong> superficie<br />

derivata <strong>di</strong> ⃗r rispetto alle variabili u e v, rispettivamente. Il <strong>di</strong>scorso da fare è del tutto analogo<br />

a quanto abbiamo visto nella sezione 7.7. L’area del parallelogramma, che approssima<br />

l’area dell’elementino, è dunque uguale al modulo del prodotto vettoriale <strong>di</strong> ∆u⃗r u (u i , v j ) e<br />

∆v⃗r v (u i , v j ).<br />

L’area della superficie sarà dunque data dalla somma <strong>di</strong> tutte queste aree, facendo tendere<br />

a infinito il numero <strong>degli</strong> elementini in cui sud<strong>di</strong>vi<strong>di</strong>amo la superficie. Si ha infatti la<br />

definizione<br />

Definizione 7.11.1 Data una superficie S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), con<br />

(u, v) ∈ D, allora l’area della superficie è data da<br />

∫∫<br />

area(S) = |⃗r u × ⃗r v |dA<br />

D<br />

dove ⃗r u = ( ∂x<br />

∂u , ∂y<br />

∂u , ∂z<br />

∂u ) e ⃗r v = ( ∂x<br />

∂v , ∂y<br />

∂v , ∂z<br />

∂v ).<br />

Nel caso in cui la superficie è data da una funzione z = f(x, y), possiamo ricondurci al<br />

caso precedente considerando ⃗r(u, v) = ⃗r(x, y) = (x, y, f(x, y)).<br />

In tal caso<br />

∣<br />

⃗i ⃗j ⃗ k<br />

∣<br />

1 0<br />

⃗r u × ⃗r v =<br />

∣0 1<br />

∂f<br />

∂x<br />

∂f<br />

∣<br />

∂y<br />

√ (∂f ) 2<br />

Perciò |⃗r u × ⃗r v | = +<br />

∂x<br />

∫∫<br />

A(S) =<br />

D<br />

√ (∂f ) 2<br />

+<br />

∂x<br />

= (− ∂f<br />

∂x , −∂f ∂y , 1)<br />

( ) 2 ∂f<br />

+ 1 e l’area della superficie è<br />

∂y<br />

( ) 2 ∂f<br />

+ 1dA<br />

∂y<br />

7.11.2 Integrale <strong>di</strong> una superficie<br />

Siamo ora in grado <strong>di</strong> capire la formula da applicare nel caso in cui bisogna calcolare<br />

l’integrale <strong>di</strong> una funzione g su una superficie S.<br />

L’area dell’elementino dS si riconduce alla formula dell’area <strong>di</strong> una superficie che abbiamo<br />

appena visto. Perciò, se la superficie S è data me<strong>di</strong>ante una funzione z = f(x, y), con (x, y) ∈<br />

D ⊂ R 2 , l’integrale <strong>di</strong> superficie <strong>di</strong> una funzione g(x, y, z) sulla superficie S è dato da<br />

∫∫<br />

S<br />

∫∫<br />

g(x, y, z)dS =<br />

D<br />

√ (∂f ) 2<br />

g(x, y, f(x, y)) +<br />

∂x<br />

( ) 2 ∂f<br />

+ 1dA<br />

∂y<br />

Dobbiamo prestare molta attenzione a questo tipo <strong>di</strong> integrali perchè l’integrale a destra è<br />

un integrale doppio mentre l’integrale a sinistra è un integrale <strong>di</strong> superficie. Quin<strong>di</strong> il calcolo<br />

<strong>di</strong> un integrale <strong>di</strong> superficie si riconduce ad un integrale doppio.<br />

La superficie potrebbe essere scritta come y = f(x, z) o x = f(y, z). La definizione <strong>di</strong><br />

integrale <strong>di</strong> superficie è analoga (con le dovute sostituzioni) a quella appena scritta.<br />

Se la superficie, invece, è scritta in forma parametrica :<br />

x = x(u, v) y = y(u, v) z = z(u, v) (u, v) ∈ I<br />

111


7. INTEGRALI<br />

allora si ha<br />

∫∫<br />

∫∫<br />

g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />

S<br />

I<br />

dove |⃗r u ×⃗r v | rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando<br />

parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo<br />

da poter avere l’area dell’elementino <strong>di</strong> superficie dS.<br />

Quin<strong>di</strong><br />

⃗i ⃗j ⃗ k<br />

∂y ∂z<br />

∂x ∂z<br />

∂x ∂y<br />

∂x ∂y ∂z<br />

∂u ∂u<br />

∂u ∂u<br />

⃗n = ⃗r u × ⃗r v =<br />

∂u ∂u ∂u<br />

=⃗i<br />

− ⃗j<br />

+ ∂y ∂z<br />

∂x ∂z<br />

⃗ ∂u ∂u<br />

k<br />

∂x ∂y<br />

∣ ∣ ∣ ∣ ∣ ∣<br />

∂x ∂y ∂z<br />

∂v ∂v ∂v ∂v ∂v ∂v<br />

∣<br />

∣<br />

∂v ∂v ∂v<br />

scambiamo le colonne del sottodeterminante relativo a ⃗j<br />

∂y ∂z<br />

∂z ∂x<br />

∂x ∂y<br />

∂u ∂u<br />

∂u ∂u<br />

=⃗i<br />

+ ⃗j<br />

+ ∂y ∂z<br />

∂z ∂x<br />

⃗ ∂u ∂u<br />

k<br />

∂x ∂y<br />

∣ ∣ ∣ ∣ ∣ ∣<br />

∂v ∂v ∂v ∂v ∂v ∂v<br />

osserviamo che i sottodeterminanti sono <strong>degli</strong> jacobiani<br />

=⃗i<br />

∂(y, z)<br />

∣∂(u, v) ∣ + ⃗j<br />

∂(z, x)<br />

∣∂(u, v) ∣ + ⃗ k<br />

∂(x, y)<br />

∣∂(u, v) ∣<br />

Chiamando con n 1 , n 2 e n 3 le componenti del vettore normale appena ottenuto, n 1 =<br />

∂(y, z)<br />

∣∂(u, v) ∣ , n 2 =<br />

∂(z, x)<br />

∣∂(u, v) ∣ e n 3 =<br />

∂(x, y)<br />

∣∂(u, v) ∣ , il modulo <strong>di</strong> ⃗n è dato da |⃗n| = √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 .<br />

Quin<strong>di</strong><br />

∫∫<br />

∫∫<br />

g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />

S<br />

D<br />

∫∫<br />

= g(x(u, v), y(u, v), z(u, v)) √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 dA<br />

D<br />

Se g(x, y, z) = 1 l’integrale <strong>di</strong> superficie ci fa ritrovare l’area della superficie.<br />

Esempio<br />

Es. 7.11.1 Calcoliamo l’integrale <strong>di</strong> superficie I = ∫∫ yzdS dove S è la superficie <strong>di</strong><br />

S<br />

equazioni parametriche x = u 2 , y = u sin (v), z = u cos (v), con 0 ≤ u ≤ 1 e 0 ≤ v ≤ π/2.<br />

L’integrale da calcolare <strong>di</strong>venta l’integrale doppio<br />

∫∫<br />

I =<br />

D<br />

u sin (v)u cos (v)|⃗r u × ⃗r v |dudv =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 2 sin (v) cos (v)|⃗r u × ⃗r v |dvdu<br />

Calcoliamo il modulo del prodotto vettoriale. Abbiamo<br />

⃗i ⃗j ⃗ k<br />

⃗r u × ⃗r v =<br />

2u sin (v) cos (v)<br />

∣ 0 u cos (v) −u sin (v) ∣ = . . . = ⃗i(−u) + ⃗j(2u 2 sin (v)) + ⃗ k(2u 2 cos (v))<br />

112


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Perciò, quando calcoliamo il modulo, abbiamo (consideriamo anche 0 ≤ u ≤ 1):<br />

√<br />

|⃗r u × ⃗r v | = u 2 + 4u 4 sin 2 (v) + 4u 4 cos 2 (v) = u √ 1 + 4u 2<br />

L’integrale è<br />

I =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 2 sin (v) cos (v)u √ 1 + 4u 2 dvdu =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 3√ 1 + 4u 2 sin (v) cos (v)dvdu<br />

Osserviamo che abbiamo funzioni che <strong>di</strong>pendono solo da v e funzioni che <strong>di</strong>pendono<br />

solo da u, perciò le funzioni che <strong>di</strong>pendono solo da u, le possiamo portare fuori<br />

dall’integrale in v, ricavando<br />

Ora<br />

I =<br />

∫ π/2<br />

0<br />

∫ 1<br />

0<br />

u 3√ ∫ π/2<br />

1 + 4u 2 sin (v) cos (v)dvdu<br />

0<br />

sin (v) cos (v)dv =<br />

∫ π/2<br />

0<br />

sin (v)D(sin (v))dv = sin2 (v)<br />

2<br />

Andando a sostituire nell’integrale doppio abbiamo<br />

I = 1 2<br />

∫ 1<br />

0<br />

u 3√ 1 + 4u 2 du<br />

Facciamo un cambiamento <strong>di</strong> variabili ponendo t = 1+4u 2 da cui u 2 = t − 1 e 2udu = dt<br />

4<br />

4 ,<br />

ovvero udu = dt . Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quin<strong>di</strong><br />

8<br />

I = 1 2<br />

= 1<br />

64<br />

= 1<br />

64<br />

∫ 1<br />

0<br />

∫ 5<br />

u 2√ 1 + 4u 2 udu = 1 2<br />

(t √ t − √ t)dt = 1<br />

1<br />

64<br />

2<br />

∣5 t5/2 − 2 ∣ ∣∣∣<br />

5<br />

3 t3/2<br />

1<br />

∫ 5<br />

1<br />

∫ 5<br />

1<br />

t − 1√ dt t<br />

4 8<br />

(t 3/2 − t 1/2 )dt<br />

= . . . = 5√ 5<br />

48 + 1<br />

240<br />

∣<br />

π/2<br />

0<br />

= 1 2<br />

7.12 Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Ve<strong>di</strong>amo da un punto <strong>di</strong> vista matematico i concetti <strong>di</strong> massa e baricentro (usualmente<br />

visti in fisica). Ci serviranno successivamente per calcolare il volume <strong>di</strong> un solido o l’area<br />

<strong>di</strong> una superficie ottenuti, rispettivamente, me<strong>di</strong>ante rotazione <strong>di</strong> una superficie o <strong>di</strong> una<br />

curva attorno ad uno <strong>degli</strong> assi.<br />

Ci limitiamo a vedere le definizioni <strong>di</strong> massa, momenti e baricentro, per il caso<br />

bi<strong>di</strong>mensionale.<br />

Definizione 7.12.1 Si definisce massa <strong>di</strong> un oggetto piano che riempe una regione C, con<br />

densità data da µ(x, y) (funzione continua), la quantià m data da<br />

∫∫<br />

m = µ(x, y)dxdy<br />

C<br />

113


7. INTEGRALI<br />

Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti<br />

sono dati da<br />

∫∫<br />

M x = yµ(x, y)dxdy<br />

C<br />

∫∫<br />

M y = xµ(x, y)dxdy<br />

C<br />

Il baricentro (o centro <strong>di</strong> massa) dell’oggetto è il punto (x, y) dato da (m essendo la massa)<br />

x = M ∫∫<br />

y<br />

m = C xµ(x, y)dxdy<br />

∫∫<br />

µ(x, y)dxdy<br />

C<br />

y = M ∫∫<br />

x<br />

m = C yµ(x, y)dxdy<br />

∫∫<br />

µ(x, y)dxdy<br />

C<br />

Nel caso <strong>di</strong> una curva piana γ, omogenea e con densità µ ≡ 1, si ha:<br />

G la massa m è data da<br />

∫<br />

m = ds =⇒ m = L (la lunghezza della curva)<br />

γ<br />

G i momenti sono<br />

∫<br />

∫<br />

M x = yds M y =<br />

G il baricentro ha coor<strong>di</strong>nate<br />

x = M y<br />

L<br />

= 1 ∫<br />

xds<br />

L<br />

γ<br />

γ<br />

γ<br />

xds<br />

y = M x<br />

L<br />

= 1 L<br />

∫<br />

γ<br />

Definiamo, a questo punto, il solido <strong>di</strong> rotazione.<br />

Sia D un insieme del piano (x, y), chiuso e limitato (e integrabile). Per semplicità i valori<br />

<strong>di</strong> y siano positivi.<br />

Una rotazione del piano (x, y) intorno all’asse x (o y) fa sì che l’insieme D generi un solido<br />

I nello spazio (x, y, z), che chiamiamo solido <strong>di</strong> rotazione.<br />

Per calcolare il volume <strong>di</strong> un solido <strong>di</strong> rotazione si ha il<br />

Teorema 7.12.1 (Primo teorema <strong>di</strong> Gul<strong>di</strong>no) Il volume dell’insieme I, solido <strong>di</strong> rotazione ottenuto<br />

dall’insieme D è uguale all’area <strong>di</strong> D per la lunghezza della circonferenza descritta nella<br />

rotazione dal baricentro <strong>di</strong> D.<br />

Supponendo che la rotazione sia fatta attorno all’asse x, il raggio della circonferenza descritta<br />

dal baricentro è data dall’or<strong>di</strong>nata del baricentro (si considera µ ≡ 1). Quin<strong>di</strong><br />

yds<br />

volume(I) = area(D) × lunghezza della circonferenza<br />

volume(I) = area(D) × 2π raggio della circonferenza<br />

volume(I) = area(D)2π y<br />

∫∫<br />

D<br />

volume(I) = area(D)2π ∫∫<br />

ydxdy<br />

D<br />

∫∫<br />

dxdy<br />

D<br />

volume(I) = area(D)2π<br />

ydxdy<br />

area(D)<br />

∫∫<br />

= 2π ydxdy<br />

D<br />

114


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Figura 7.16: Insieme D da cui calcolare il volume del solido <strong>di</strong> rotazione attorno all’asse x.<br />

Se la rotazione <strong>di</strong> D avviene attorno all’asse y, il volume del solido <strong>di</strong> rotazione è data da<br />

∫∫<br />

volume(I) = 2π xdxdy<br />

D<br />

perchè la circonferenza descritta dal baricentro ha raggio dato da x.<br />

Definiamo, ora, la superficie <strong>di</strong> rotazione.<br />

Sia γ una curva generalmente regolare del piano (x, y). Sia y > 0. Consideriamo l’asse<br />

z ortogonale in (0, 0) al piano (x, y). Una rotazione del piano (x, y) intorno all’asse x (o y) fa<br />

sì che la curva γ generi una superficie S nello spazio (x, y, z), che chiamiamo superficie <strong>di</strong><br />

rotazione.<br />

Per misurare l’area <strong>di</strong> una superficie <strong>di</strong> rotazione si ha il<br />

Teorema 7.12.2 (Secondo teorema <strong>di</strong> Gul<strong>di</strong>no) L’area della superficie <strong>di</strong> rotazione S generata<br />

dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza<br />

descritta nella rotazione dal baricentro <strong>di</strong> γ.<br />

Sia γ data da equazioni parametriche x = x(t), y = y(t) con t ∈ [a, b] e <strong>di</strong> lunghezza L.<br />

La superficie sia ottenuta me<strong>di</strong>ante rotazione attorno all’asse x. Allora la circonferenza ha<br />

raggio y con y = 1 ∫<br />

L<br />

γ yds = 1 ∫ b<br />

L<br />

a y(t)√ (x ′ (t)) 2 + (y ′ (t)) 2 dt. Allora<br />

area(S) = lunghezza della curva × lunghezza della circonferenza<br />

area(S) = L2π y<br />

area(S) = L2π 1 L<br />

area(S) = 2π<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

Se la rotazione avviene attorno all’asse y invece si ha<br />

area(S) = 2π<br />

∫ b<br />

a<br />

x(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

115


7. INTEGRALI<br />

Esempio<br />

Es. 7.12.1 Calcoliamo il volume del solido <strong>di</strong> rotazione ottenuto dalla rotazione completa<br />

attorno all’asse x dell’insieme<br />

{<br />

D = (x, y) ∈ R 2 : x 2 + y 2 ≤ 3 }<br />

4 , x2 ≥ y, y ≥ 0, x ≥ 0<br />

Per calcolare questo integrale dobbiamo applicare il primo teorema <strong>di</strong> Gul<strong>di</strong>no. Il volume<br />

richiesto sarà dato da<br />

∫∫<br />

V = 2π ydxdy<br />

D<br />

L’insieme D è dato dalla regione compresa al <strong>di</strong> sotto della parabola y = x 2 e all’interno<br />

della circonferenza con centro nell’origine e raggio r = √ 3/2, che si trova nel primo<br />

quadrante (si veda Figura 7.16).<br />

Cerchiamo i punti <strong>di</strong> intersezione tra la parabola e la circonferenza risolvendo il sistema<br />

⎧<br />

⎨y = x 2<br />

⎩x 2 + y 2 = 3 4<br />

Sostituendo y = x 2 nella seconda equazione si ha x 2 + x 4 = 3 . Con la sostituzione<br />

4<br />

t = x 2 l’equazione <strong>di</strong>venta t 2 + t − 3 4 = 0 da cui t = −1 ± √ 1 + 3<br />

= −1 ± 2 : quin<strong>di</strong><br />

2<br />

2<br />

le due ra<strong>di</strong>ci sono t = 1 2 e t = −3 2 . Ritornando a x2 = t, si ha come soluzione del<br />

primo quadrante il punto x = √ 1 e y = 1 . Per calcolare l’integrale, possiamo vedere il<br />

2 2<br />

dominio <strong>di</strong> integrazione come normale rispetto all’asse x, considerando l’unione <strong>di</strong> due<br />

insiemi, il primo dato da 0 ≤ x ≤ √ 1 , e 0 ≤ y ≤ x 2 , e il secondo dato da √ 1 ≤ x ≤ 3 2 2 2 e<br />

0 ≤ y ≤<br />

√<br />

3<br />

4 − x2 .<br />

Quin<strong>di</strong> l’integrale da calcolare va spezzato in due integrali su questi domini. Oppure,<br />

si può vedere il dominio <strong>di</strong> integrazione normale rispetto all’asse y, con 0 ≤ y ≤ 1 2 e<br />

√ y ≤ x ≤<br />

√<br />

3<br />

4 − y2 .<br />

In tal caso l’integrale <strong>di</strong>venta<br />

Si ha<br />

V =<br />

V =<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

= − 1 2<br />

∫ √ 3<br />

4 −y2<br />

√ y<br />

ydxdy<br />

y(√<br />

3<br />

4 − y2 − √ y)dy =<br />

∫ 1/2<br />

0<br />

(−2y)√<br />

3<br />

4 − y2 dy −<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

y√<br />

3<br />

4 − y2 dy −<br />

y 3/2 dy = − 1 2<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

y √ ydy<br />

D( 3 4 − y2 )<br />

√<br />

3<br />

4 − y2 dy − 2 5 y5/2 ∣ ∣∣∣<br />

1/2<br />

0<br />

116


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

= − 1 2<br />

Esempio<br />

∣<br />

2<br />

∣∣∣<br />

1/2<br />

3 (3 4 − y2 ) 3/2<br />

0<br />

− 1<br />

10 √ 2 = −1 3 (1 2 )3/2 + 1 3 (3 4 )3/2 − 1<br />

10 √ 2<br />

= − 1<br />

√<br />

3<br />

6 √ 2 + 8 − 1<br />

10 √ 2 = − 4<br />

√ √ √<br />

3 2 3<br />

14 √ 2 + 8 = − 7 + 8<br />

Es. 7.12.2 L’arco <strong>di</strong> parabola y = x 2 per 1 ≤ x ≤ 2 è ruotato attorno all’asse y. Vogliamo<br />

trovare l’area della superficie <strong>di</strong> rotazione. In questo caso dobbiamo applicare il secondo<br />

teorema <strong>di</strong> Gul<strong>di</strong>no, vedendo la parabola come la curva <strong>di</strong> coor<strong>di</strong>nate parametriche x = x,<br />

y = x 2 , per cui<br />

Quin<strong>di</strong><br />

area(S) = 2π<br />

∫ 2<br />

1<br />

∫ 2<br />

area(S) = 2π<br />

1<br />

x √ 1 + 4x 2 dx.<br />

8x<br />

8<br />

= 1 4 π 2(1 + 4x2 ) 3/2<br />

3<br />

√<br />

1 + 4x2 dx = 1 ∫ 2<br />

4 π D(1 + 4x 2 ) √ 1 + 4x 2 dx<br />

∣<br />

= 1 6 π(17√ 17 − 5 √ 5)<br />

2<br />

1<br />

= 1 6 π(173/2 − 5 3/2 )<br />

1<br />

117


CAPITOLO 8<br />

Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie<br />

L’ignoranza per la matematica<br />

viene considerato un fatto<br />

positivo, a un certo livello della<br />

classe sociale. Eppure la<br />

matematica ha determinato la<br />

<strong>di</strong>rezione e il contenuto <strong>di</strong><br />

buona parte del pensiero<br />

filosofico, ha <strong>di</strong>strutto e<br />

ricostruito dottrine religiose,<br />

ha costituito il nerbo <strong>di</strong> teorie<br />

economiche e sociali, ha<br />

plasmato i principali stili<br />

pittorici, musicali,<br />

architettonici e letterari.<br />

Morris Kline (1908-1992)<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />

8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . . 122<br />

8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . . 123<br />

8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . 126<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />

8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />

8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />

8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />

8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . . 132<br />

8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale<br />

Un’equazione <strong>di</strong>fferenziale è un’equazione che coinvolge una funzione incognita y = y(x)<br />

(che <strong>di</strong>pende dalla sola variabile x) e le sue derivate. Usualmente si parla <strong>di</strong> equazione <strong>di</strong>fferenziale<br />

or<strong>di</strong>naria 1 in quanto la funzione incognita, essendo funzione <strong>di</strong> una sola variabile,<br />

ammette derivate or<strong>di</strong>narie e non derivate parziali.<br />

1 In inglese si <strong>di</strong>ce: Or<strong>di</strong>nary Differential Equation, da cui la sigla ODE.<br />

119


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Un esempio <strong>di</strong> equazione <strong>di</strong>fferenziale lineare è dato da<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue che <strong>di</strong>pendono<br />

dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />

fino a quella <strong>di</strong> or<strong>di</strong>ne n. Usiamo infatti la notazione y (n) per in<strong>di</strong>care dn y<br />

dx n .<br />

Se nell’equazione <strong>di</strong>fferenziale compaiono le derivate <strong>di</strong> y fino all’or<strong>di</strong>ne n, allora si <strong>di</strong>ce<br />

che l’equazione <strong>di</strong>fferenziale ha or<strong>di</strong>ne (o grado) n. Bisogna quin<strong>di</strong> vedere l’or<strong>di</strong>ne più elevato<br />

della derivata che appare nell’equazione per capire l’or<strong>di</strong>ne dell’equazione <strong>di</strong>fferenziale.<br />

Per n = 1, l’equazione <strong>di</strong>fferenziale <strong>di</strong> prima <strong>di</strong>venta<br />

y ′ + a(x)y = b(x)<br />

Per n = 2 si ha, invece,<br />

y ′′ + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

Il caso più generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale <strong>di</strong> or<strong>di</strong>ne n è dato da un’equazione che<br />

ha come variabili x, la funzione incognita y e le sue derivate fino all’or<strong>di</strong>ne n, me<strong>di</strong>ante una<br />

funzione continua F (in genere non lineare):<br />

F (x, y, y ′ , . . . , y (n) ) = 0<br />

L’esempio <strong>di</strong> prima, <strong>di</strong> equazione <strong>di</strong>fferenziale lineare, ha come F la funzione<br />

F (x, y, y ′ , . . . , y (n) ) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y − b(x)<br />

Risolvere un’equazione <strong>di</strong>fferenziale (si <strong>di</strong>ce anche integrare un’equazione <strong>di</strong>fferenziale)<br />

vuol <strong>di</strong>re cercare le possibili (ve ne possono essere più <strong>di</strong> una) funzioni del tipo y = y(x)<br />

definite per x che varia in un opportuno intervallo [a, b], continue e derivabili n volte in [a, b]<br />

in modo che sia sod<strong>di</strong>sfatta l’equazione <strong>di</strong>fferenziale data.<br />

Le funzioni y = y(x) che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale si <strong>di</strong>cono soluzioni o integrali<br />

dell’equazione <strong>di</strong>fferenziale.<br />

Se un’equazione <strong>di</strong>fferenziale può essere scritta nella forma<br />

y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />

con f funzione continua allora si <strong>di</strong>ce che l’equazione <strong>di</strong>fferenziale è in forma normale.<br />

Esempio<br />

Es. 8.1.1 Data f, funzione continua in [a, b], si vuole risolvere<br />

y ′ (x) = f(x) ∀x ∈ [a, b]<br />

Questo problema equivale a quello <strong>di</strong> trovare una primitiva della funzione f, una<br />

funzione, cioè, la cui derivata coincide con f.<br />

Ogni funzione della forma y(x) = F (x) + y 0 con y 0 costante e F una primitiva <strong>di</strong> f è<br />

soluzione del problema assegnato, ovvero dell’equazione <strong>di</strong>fferenziale. Come primitiva<br />

<strong>di</strong> f, dal teorema fondamentale del calcolo integrale, sappiamo che possiamo scrivere<br />

F (x) = ∫ x<br />

x 0<br />

f(t)dt dove x 0 è un numero reale fissato in [a, b]. Quin<strong>di</strong> y(x) = ∫ x<br />

x 0<br />

f(t)dt + y 0 è<br />

soluzione del problema dato.<br />

120


8.2. Il problema <strong>di</strong> Cauchy in locale<br />

L’esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione<br />

y(x) per x = x 0 vale proprio la costante y 0 :<br />

y(x 0 ) =<br />

∫ x0<br />

x 0<br />

f(t)dt + y 0 = y 0<br />

In questo caso, si <strong>di</strong>ce che y(x) è soluzione del problema <strong>di</strong> Cauchy dato da<br />

{<br />

y ′ (x) = f(x)<br />

y(x 0 ) = y 0<br />

dove y(x 0 ) = y 0 rappresenta la con<strong>di</strong>zione iniziale e x 0 il punto iniziale da cui far partire<br />

la soluzione al problema.<br />

Ve<strong>di</strong>amo dunque cosa è un problema <strong>di</strong> Cauchy.<br />

8.2 Il problema <strong>di</strong> Cauchy in locale<br />

Partiamo dal considerare l’equazione <strong>di</strong>fferenziale<br />

y ′ = f(x, y)<br />

Se la f è non lineare, è ragionevole aspettarsi che le soluzioni dell’equazioni <strong>di</strong>fferenziale<br />

siano definite non in un intervallo assegnato a priori ma solo in un intorno <strong>di</strong> un punto<br />

iniziale assegnato.<br />

Fissati, dunque, x 0 e y 0 , supponiamo che:<br />

1. la f sia definita in un intorno rettangolare I × J del punto (x 0 , y 0 ) del tipo (siano a e b<br />

assegnati)<br />

{<br />

}<br />

I × J = (x, y) ∈ R 2 t.c x 0 − a ≤ x ≤ x 0 + a, y 0 − b ≤ y ≤ y 0 + b<br />

2. la f sia continua in I × J<br />

3. la derivata parziale della f rispetto a y, ∂f , sia continua in I × J.<br />

∂y<br />

Sotto queste ipotesi esiste un intorno <strong>di</strong> x 0 , [x 0 − δ, x 0 + δ] ed un’unica funzione y = y(x)<br />

derivabile in [x 0 − δ, x 0 + δ] che è soluzione del problema <strong>di</strong> Cauchy dato da<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Abbiamo appena stabilito una formulazione del teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità<br />

locale (in piccolo).<br />

Teorema 8.2.1 (Teorema <strong>di</strong> Cauchy (in piccolo) per equazioni <strong>di</strong>fferenziali del primo or<strong>di</strong>ne)<br />

Sia f = f(x, y) una funzione reale definita nell’intervallo I × J (definito in precedenza). Se f<br />

e la sua derivata ∂f sono funzioni continue in I × J, allora esiste un numero δ > 0 ed esiste<br />

∂y<br />

una ed una sola funzione y = y(x) derivabile in [x 0 − δ, x 0 + δ], soluzione in tale intervallo del<br />

problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

121


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n, il problema <strong>di</strong> Cauchy prevede con<strong>di</strong>zioni iniziali<br />

non solo sulla funzione incognita y ma anche sulle sue derivate fino a quella <strong>di</strong> or<strong>di</strong>ne n − 1.<br />

Consideriamo, infatti, un punto (x 0 , y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />

0 ) ∈ R × R n . Sia I l’intervallo [x 0 −<br />

a, x 0 + a] (con a ∈ R), e J sia un intorno <strong>di</strong> R n del punto Y 0 = (y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />

0 ), quin<strong>di</strong><br />

J = {Y ∈ R n t.c. |Y − Y 0 | ≤ b}<br />

dove b ∈ R√<br />

e |Y − Y 0 | è il modulo del vettore Y − Y 0 (quin<strong>di</strong> se Y = (y 1 , y 2 , y 3 , . . . , y n ) si ha<br />

|Y − Y 0 | = (y 0 − y 1 ) 2 + (y 0 ′ − y 2) 2 + . . . (y (n−1)<br />

0 − y n ) 2 ).<br />

Vale il seguente teorema.<br />

Teorema 8.2.2 (Teorema <strong>di</strong> Cauchy in piccolo per eq. <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n) Sia f =<br />

f(x, y 1 , y 2 , y 3 , . . . , y n ) una funzione definita per x ∈ I e (y 1 , y 2 , . . . , y n ) ∈ J (I e J definiti prima).<br />

Sia f continua insieme alle derivate parziali fatte rispetto a y 1 , y 2 , . . . , y n . Allora esiste un<br />

numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x 0 − δ, x 0 + δ], che è<br />

soluzione del seguente problema <strong>di</strong> Cauchy:<br />

⎧<br />

y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />

y(x 0 ) = y 0<br />

⎪⎨ y ′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

Con il teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità locale, sono date delle con<strong>di</strong>zioni sufficienti<br />

per risolvere localmente, in piccolo, il problema <strong>di</strong> Cauchy, determinando una soluzione<br />

in un intorno del punto iniziale x 0 .<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale)<br />

A volte è importante stabilire l’esistenza della soluzione del problema <strong>di</strong> Cauchy per un’equazione<br />

<strong>di</strong>fferenziale or<strong>di</strong>naria in un intervallo prefissato (quin<strong>di</strong> non in un intorno <strong>di</strong> x 0 ),<br />

cioè assegnato a priori, in cui l’equazione <strong>di</strong>fferenziale è definita.<br />

Per stabilire delle con<strong>di</strong>zioni sufficienti per risolvere globalmente, o in grande, il problema<br />

<strong>di</strong> Cauchy, occorre avere con<strong>di</strong>zioni più restrittive sulla funzione f.<br />

Nel caso <strong>di</strong> un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne, si hanno queste con<strong>di</strong>zioni:<br />

1. f(x, y) è definita in una striscia verticale <strong>di</strong> R 2 data da<br />

{<br />

}<br />

[a, b] × R = (x, y) ∈ R 2 t.c. x ∈ [a, b], y ∈ R<br />

2. f è continua<br />

3. la derivata parziale <strong>di</strong> f rispetto a y è continua e limitata, quin<strong>di</strong><br />

∣<br />

∂f(x, y)<br />

∂y<br />

∣ ≤ L per ogni<br />

(x, y) ∈ [a, b] × R, con L numero reale positivo.<br />

In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Possiamo enunciare il teorema:<br />

122


8.4. Definizioni<br />

Teorema 8.3.1 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. del primo or<strong>di</strong>ne))<br />

∂f(x, y)<br />

Se f = f(x, y) è continua in [a, b] × R e la sua derivata è continua e limitata in [a, b] × R,<br />

∂y<br />

allora per ogni x 0 ∈]a, b[ e per ogni y 0 ∈ R esiste una ed una sola funzione y = y(x), derivabile<br />

in [a, b] che risolve su tutto l’intervallo [a, b] il problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n il teorema precedente si generalizza considerando<br />

funzioni f = f(x, y 1 , y 2 , y 3 , . . . , y n ) = f(x, Y ) definite nella striscia [a, b] × R n con<br />

{<br />

}<br />

[a, b] × R n = (x, Y ) = (x, y 1 , y 2 , y 3 , . . . , y n ) ∈ R n+1 , con x ∈ [a, b], y 1 ∈ R, . . . , y n ∈ R<br />

Teorema 8.3.2 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. <strong>di</strong> or<strong>di</strong>ne n))<br />

Se f = f(x, y 1 , y 2 , y 3 , . . . , y n ) è continua in [a, b] × R n e le derivate parziali fatte rispetto a y 1 ,<br />

y 2 , . . . , y n sono continue e limitate in [a, b] × R n , allora per ogni x 0 ∈]a, b[ e per ogni punto <strong>di</strong> R n<br />

dato da (y 0 , y 0, ′ . . . , y (n−1)<br />

0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che<br />

è soluzione del seguente problema <strong>di</strong> Cauchy:<br />

⎧<br />

y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />

y(x 0 ) = y 0<br />

⎪⎨ y ′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

8.4 Definizioni<br />

Consideriamo ora un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne e introduciamo le seguenti<br />

definizioni.<br />

G Per integrale generale si intende l’insieme delle soluzioni dell’equazione <strong>di</strong>fferenziale<br />

che varia al variare <strong>di</strong> una costante c: qualunque sia la coppia (x 0 , y 0 ) si può stabilire il<br />

valore della costante c tale che y(c, x 0 ) = y 0 .<br />

G Per integrale particolare si intende invece una soluzione particolare dell’equazione<br />

<strong>di</strong>fferenziale: fissata una coppia (x 0 , y 0 ) esiste una costante c tale che y(c, x 0 ) = y 0 .<br />

G Si ha invece un integrale singolare se, data una coppia (x 0 , y 0 ), non esiste una costante c<br />

tale che y(c, x 0 ) = y 0 , vale a <strong>di</strong>re che per quella coppia <strong>di</strong> dati, la soluzione dell’equazione<br />

<strong>di</strong>fferenziale non rientra in un integrale particolare.<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne<br />

Sia y ′ = f(x, y) con f funzione lineare in y, del tipo f(x, y) = b(x) − a(x)y.<br />

Si ha, quin<strong>di</strong>, per l’equazione <strong>di</strong>fferenziale:<br />

y ′ = f(x, y) =⇒ y ′ = b(x) − a(x)y =⇒ y ′ + a(x)y = b(x)<br />

Ve<strong>di</strong>amo ora tutti i passaggi per trovare l’integrale generale <strong>di</strong> questa equazione<br />

<strong>di</strong>fferenziale.<br />

1. Sia A(x) = ∫ a(x)dx una primitiva <strong>di</strong> a(x). Poniamo m(x) = e A(x) .<br />

123


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

2. Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x), ottenendo:<br />

m(x)y ′ (x) + m(x)a(x)y(x) = m(x)b(x) (8.1)<br />

3. Consideriamo ora la derivata <strong>di</strong> m(x). Si ha<br />

dm(x)<br />

dx<br />

= deA(x)<br />

dx<br />

A(x) dA(x)<br />

= e = m(x) dA(x)<br />

dx<br />

dx<br />

ma essendo A(x) una primitiva <strong>di</strong> a(x) vuole <strong>di</strong>re che dA(x)<br />

dx<br />

dm(x)<br />

dx<br />

= m(x)a(x)<br />

= a(x), da cui si ricava<br />

4. Facciamo ora la derivata <strong>di</strong> y(x)m(x). Abbiamo da fare la derivata <strong>di</strong> un prodotto <strong>di</strong><br />

funzioni, da cui<br />

d(y(x)m(x))<br />

dx<br />

= dy(x)<br />

dx<br />

m(x) + y(x)dm(x) dx<br />

La derivata <strong>di</strong> m(x) l’abbiamo appena ricavata, la derivata <strong>di</strong> y(x) è y ′ (x), da cui<br />

d(y(x)m(x))<br />

dx<br />

= m(x)y ′ (x) + m(x)a(x)y(x)<br />

Abbiamo trovato il primo membro dell’equazione 8.1.<br />

5. Possiamo quin<strong>di</strong> riscrivere l’equazione 8.1 come<br />

d(y(x)m(x))<br />

dx<br />

= m(x)b(x)<br />

6. Integrando ambo i membri dell’equazione e <strong>di</strong>videndo poi per m(x) (<strong>di</strong>versa da zero<br />

perche è e A(x) ) si ha<br />

∫ ∫<br />

dy(x)m(x)<br />

dx = m(x)b(x)dx + costante<br />

dx<br />

∫<br />

y(x)m(x) = m(x)b(x)dx + costante<br />

y(x) = 1 (∫<br />

)<br />

m(x)b(x)dx + costante<br />

m(x)<br />

7. Riscrivendo la funzione m(x) come e A(x) si ha<br />

(∫<br />

)<br />

y(x) = e −A(x) e A(x) b(x)dx + costante<br />

L’integrale è generale perchè <strong>di</strong>pende da una costante.<br />

Osserviamo, inoltre, che se a(x) e b(x) sono continue in un certo intervallo [a, b], allora il<br />

problema <strong>di</strong> Cauchy che possiamo associare a questa equazione <strong>di</strong>fferenziale si può risolvere<br />

globalmente in [a, b]×R poichè valgono le ipotesi del teorema <strong>di</strong> esistenza e unicità globale (la<br />

funzione f = b(x)−a(x)y è continua e la derivata ∂f = −a(x) è continua e limitata (poichè a(x)<br />

∂y<br />

<strong>di</strong>pende solo da x ed è continua in un intervallo chiuso allora ammette minimo e massimo,<br />

cioè è limitata).<br />

124


8.6. Metodo <strong>di</strong> separazione delle variabili<br />

Esempio<br />

Es. 8.5.1 Risolviamo l’equazione <strong>di</strong>fferenziale y ′ + 4xy = x. In questo esempio a(x) = 4x<br />

e b(x) = x. Applichiamo il proce<strong>di</strong>mento appena descritto.<br />

G A(x) = ∫ a(x)dx = ∫ 4xdx = 2x 2 da cui m(x) = e 2x2 .<br />

G Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x) ricavando:<br />

e 2x2 y ′ (x) + e 2x2 4xy(x) = e 2x2 x<br />

G Abbiamo allora<br />

dy(x)e 2x2<br />

dx<br />

= e 2x2 x<br />

G Integrando ambo i membri e <strong>di</strong>videndo poi per e 2x2 si ha<br />

∫<br />

y(x) = e −2x2 e 2x2 xdx<br />

Dobbiamo quin<strong>di</strong> calcolare ∫ e 2x2 xdx: considerando che la derivata dell’esponente è<br />

4x, basta moltiplicare e <strong>di</strong>videre per 4 ottenendo:<br />

∫<br />

e 2x2 xdx = 1 ∫<br />

4xe 2x2 dx = 1 ∫<br />

D(2x 2 )e 2x2 dx = 1 + costante<br />

4<br />

4<br />

4 e2x2<br />

Quin<strong>di</strong><br />

y(x) = e −2x2 ( 1 4 e2x2 + costante) = 1 4 + Ce−2x2<br />

dove C rappresenta la costante.<br />

8.6 Metodo <strong>di</strong> separazione delle variabili<br />

Se un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne può essere scritta nella forma<br />

y ′ (x) = p(x)q(y)<br />

con p(x) e q(y) continue, allora l’equazione si <strong>di</strong>ce a variabili separabili.<br />

Ve<strong>di</strong>amo come si risolve questa equazione nel caso in cui q(y) ≠ 0 per ogni y. In tal caso,<br />

possiamo <strong>di</strong>videre ambo i membri per q(y), ottenendo<br />

y ′ (x)<br />

q(y) = p(x)<br />

Integriamo ambo i membri dell’equazione rispetto a x, ricavando:<br />

∫<br />

y ′ ∫<br />

(x)<br />

q(y(x)) dx = p(x)dx (8.2)<br />

In modo equivalente possiamo scrivere anche<br />

∫<br />

∫<br />

1<br />

q(y) dy = p(x)dx<br />

125


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Sia Q(y) una primitiva <strong>di</strong><br />

dQ(y(x))<br />

dx<br />

= dQ(y(x))<br />

dy<br />

1<br />

e P una primitiva <strong>di</strong> p. Vuol <strong>di</strong>re che<br />

q(y)<br />

dy<br />

dx = 1<br />

q(y(x)) y′ (x),<br />

dP (x)<br />

mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive <strong>di</strong><br />

dx<br />

ciascuno dei due integrali, si ha<br />

Q(y(x)) = P (x) + costante<br />

Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo<br />

lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione me<strong>di</strong>ante<br />

la relazione Q(y(x)) − P (x) = costante.<br />

Esempio<br />

Es. 8.6.1 Sia da risolvere il problema <strong>di</strong> Cauchy, y ′ = x2<br />

con la con<strong>di</strong>zione iniziale y(0) =<br />

y2 4.<br />

Risolviamo prima l’equazione <strong>di</strong>fferenziale, applicando il metodo <strong>di</strong> separazione delle<br />

variabili (p(x) = x 2 , q(y) = 1 ). Separando le variabili infatti, abbiamo da risolvere:<br />

y2 ovvero<br />

∫ ∫<br />

y 2 dy = x 2 dx<br />

y 3<br />

3 = x3<br />

3 + costante<br />

Risolvendo ora per y (che è funzione <strong>di</strong> x) otteniamo:<br />

y(x) = (x 3 + 3costante) 1/3<br />

Poichè la costante è arbitraria possiamo scrivere C = 3costante ricavando<br />

y(x) = (x 3 + C) 1/3<br />

Imponiamo ora la con<strong>di</strong>zione iniziale y(0) = 4. Deve essere 4 = (C) 1/3 da cui C = 4 3 = 64.<br />

Quin<strong>di</strong> la soluzione del problema è data da y(x) = (x + 64) 1/3 .<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali<br />

G Sia data un’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne, in cui manca il termine in y:<br />

F (x, y ′ , y ′′ ) = 0<br />

In tal caso, si pone z(x) = y ′ (x), da cui z ′ (x) = y ′′ (x).<br />

trasformata <strong>di</strong>venta:<br />

F (x, z, z ′ ) = 0<br />

L’equazione <strong>di</strong>fferenziale<br />

Abbiamo un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne nella incognita z. Una volta trovata<br />

z soluzione dell’equazione <strong>di</strong>fferenziale, quin<strong>di</strong> z = z(x, cost 1 ), si ricava y cercando<br />

una primitiva <strong>di</strong> z:<br />

∫<br />

y(x) = z(x, cost 1 )dx + cost 2<br />

126


8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />

G Se l’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne non <strong>di</strong>pende esplicitamente da x<br />

F (y, y ′ , y ′′ ) = 0<br />

allora si pensa y come variabile in<strong>di</strong>pendente e si si pone z(y) = y ′ .<br />

Allora (considerando che y è funzione <strong>di</strong> x e z è funzione <strong>di</strong> y):<br />

y ′′ = dy′<br />

dx = dz(y)<br />

dx<br />

= dz dy<br />

dy dx = z′ z<br />

Quin<strong>di</strong> l’equazione <strong>di</strong>fferenziale <strong>di</strong>venta<br />

F (y, z, z ′ z) = 0<br />

Se si trova un’integrale generale <strong>di</strong> questa equazione, z = z(y, cost), allora, per trovare<br />

y, dalla relazione y ′ = z(y, cost) si ricava la soluzione y osservando che questa che<br />

abbiamo appena scritto è un’equazione <strong>di</strong>fferenziale a variabili separabili.<br />

G Ci sono molti altri casi <strong>di</strong> equazioni <strong>di</strong>fferenziali non lineari che presentano una forma<br />

particolare e che possono essere risolte me<strong>di</strong>ante tecniche ad hoc. Non stiamo però a<br />

stu<strong>di</strong>arle in questa sede.<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari<br />

Ripren<strong>di</strong>amo l’esempio visto quando abbiamo introdotto le equazioni <strong>di</strong>fferenziali:<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue, che <strong>di</strong>pendono<br />

dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />

fino a quella <strong>di</strong> or<strong>di</strong>ne n.<br />

Un’equazione <strong>di</strong>fferenziale scritta in questa forma, prende il nome <strong>di</strong> equazione<br />

<strong>di</strong>fferenziale lineare, perchè è lineare rispetto a y e alle sue derivate.<br />

G Se ciascuna funzione a i (x), per i = 0, 2, . . . , n−1 è costante rispetto alla variabile x, allora<br />

l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale lineare a coefficienti<br />

costanti.<br />

G Se b(x) = 0 per ogni valore <strong>di</strong> x, allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale<br />

omogenea.<br />

G Se b(x) ≠ 0 allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale non omogenea.<br />

L’equazione che si ha ponendo b(x) ≡ 0 si <strong>di</strong>ce equazione omogenea associata<br />

all’equazione <strong>di</strong> partenza in cui b(x) ≠ 0.<br />

Per quanto riguarda il problema <strong>di</strong> Cauchy associato ad un’equazione <strong>di</strong>fferenziale lineare<br />

<strong>di</strong> or<strong>di</strong>ne n, vale il seguente teorema.<br />

Teorema 8.8.1 Se le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x) sono continue in un intervallo [a, b], allora<br />

il problema <strong>di</strong> Cauchy<br />

⎧<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)y(x 0 ) = y 0<br />

y ⎪⎨<br />

′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

ammette sempre un’unica soluzione y(x) qualunque sia il punto (x 0 , y 0 , y ′ 0, . . . , y (n−1)<br />

0 ) associato<br />

alle con<strong>di</strong>zioni iniziali.<br />

127


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Dimostrazione.<br />

Infatti, l’equazione <strong>di</strong>fferenziale si può scrivere come<br />

y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />

con f(x, y, y ′ , . . . , y (n−1) ) = b(x) − a n−1 (x)y (n−1) − . . . − a 1 (x)y ′ − a 0 (x)y.<br />

Riscrivendo la f come una funzione <strong>di</strong>pendente da x e da un punto Y = (y 1 , y 2 , . . . , y n ),<br />

(quin<strong>di</strong> f(x, Y ) = b(x) − a n−1 (x)y n − . . . a 1 (x)y 2 − a 0 (x)y 1 ) si ha che<br />

∂f<br />

∂y i<br />

= −a i−1 (x)<br />

Quin<strong>di</strong> ciascuna derivata è una funzione continua e limitata in [a, b] per cui sono sod<strong>di</strong>sfatte<br />

le ipotesi del teorema <strong>di</strong> Cauchy in grande, qualcunque sia il punto iniziale assegnato.<br />

✔<br />

Per provare alcune proprietà generali delle equazioni <strong>di</strong>fferenziali lineari, conviene introdurre<br />

alcune notazioni. La prima consiste nel vedere l’equazione <strong>di</strong>fferenziale come il<br />

risultato <strong>di</strong> un operatore L applicato alla funzione y(x).<br />

Introduciamo dunque l’operatore L che agisce su una funzione f(x) nel modo seguente:<br />

L(f) = f (n) + a n−1 (x)f (n−1) + a n−2 (x)f (n−2) + . . . + a 0 (x)f<br />

Introducendo i simboli D e D n per in<strong>di</strong>care la derivata prima e la derivata n-sima rispetto<br />

a x, D = d<br />

dx , Dn = dn<br />

, l’operatore L si può scrivere come<br />

dxn L = D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x)<br />

Allora l’equazione <strong>di</strong>fferenziale lineare<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

può essere scritta come<br />

L(y) = b(x)<br />

Difatti:<br />

L(y) = (D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x))y<br />

= D n (y) + a n−1 (x)D n−1 (y) + . . . + a 0 (x)y<br />

= y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y<br />

Usando l’operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale:<br />

1. L(y 1 + y 2 ) = L(y 1 ) + L(y 2 )<br />

2. L(αy) = αL(y), dove α è una costante.<br />

Queste due proprietà <strong>di</strong>cono che L è un operatore lineare.<br />

Quin<strong>di</strong>, dato l’operatore L appena definito:<br />

G L(y) = b(x) è un’equazione <strong>di</strong>fferenziale lineare non omogenea. La funzione b(x) prende<br />

il nome <strong>di</strong> termine noto dell’equazione <strong>di</strong>fferenziale.<br />

G L(y) = 0 è l’equazione <strong>di</strong>fferenziale omogenea (il termine noto vale zero) associata<br />

all’equazione <strong>di</strong>fferenziale precedente, in quanto l’operatore L è lo stesso.<br />

Possiamo stabilire questo risultato.<br />

Teorema 8.8.2 Se y 1 , y 2 , . . . , y m sono un numero finito m <strong>di</strong> soluzioni dell’equazione <strong>di</strong>fferenziale<br />

lineare omogenea L(y) = 0, allora anche ogni funzione data da c 1 y 1 + c 2 y 2 + . . . + c m y m ,<br />

con c 1 , c 2 , . . . , c m costanti <strong>di</strong> R, è soluzione <strong>di</strong> L(y) = 0,<br />

128


8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />

Dimostrazione. La <strong>di</strong>mostrazione segue dal fatto che L è un operatore lineare. Da<br />

L(y 1 ) = 0, L(y 2 ) = 0, . . . L(y m ) = 0, e applicando la linearità <strong>di</strong> L, si ha<br />

✔<br />

L(c 1 y 1 + c 2 y 2 + . . . + c m y m ) = L(c 1 y 1 ) + L(c 2 y 2 ) + . . . L(c m y m )<br />

= c 1 L(y 1 ) + c 2 L(y 2 ) + . . . + c m L(y m )<br />

= 0<br />

Teorema 8.8.3 Data l’equazione <strong>di</strong>fferenziale L(y) = 0 con le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x)<br />

continue in un intervallo [a, b], allora per ogni x 0 ∈]a, b[, la funzione identicamente nulla è l’unica<br />

soluzione del problema <strong>di</strong> Cauchy L(y) = 0 con con<strong>di</strong>zioni iniziali date da<br />

y(x 0 ) = 0, y ′ (x 0 ) = 0, . . . , y (n−1) (x 0 ) = 0<br />

Dimostrazione. La <strong>di</strong>mostrazione segue dal teorema <strong>di</strong> esistenza ed unicità del problema<br />

<strong>di</strong> Cauchy, considerando che la funzione nulla risolve l’equazione <strong>di</strong>fferenziale con le<br />

con<strong>di</strong>zioni iniziali tutte nulle. ✔<br />

Chiamiamo con il simbolo N l’insieme delle soluzioni <strong>di</strong> un’equazione <strong>di</strong>fferenziale lineare<br />

omogenea data me<strong>di</strong>ante l’operatore L. Questo insieme prende il nome <strong>di</strong> spazio nullo<br />

dell’operatore L. L’insieme N è uno spazio vettoriale sul campo dei reali.<br />

8.8.1 Cosa è uno spazio vettoriale<br />

Consideriamo un insieme N (non necessariamente quello <strong>di</strong> prima), costituito da funzioni<br />

reali definite in R. Sia 0 lo zero <strong>di</strong> N, vale a <strong>di</strong>re la funzione identicamente nulla.<br />

N è uno spazio vettoriale (sui reali), se:<br />

G è possibile definire un’operazione interna + sugli elementi dell’insieme N, chiamata<br />

somma, che gode della proprietà associativa e commutativa, per la quale esiste<br />

l’elemento neutro (lo zero), e ogni elemento ha l’opposto.<br />

G è possibile definire un’operazione esterna · <strong>degli</strong> elementi <strong>di</strong> N sui reali, chiamata<br />

prodotto per la quale<br />

– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 c 2 ) · f = c 1 · (c 2 · f)<br />

– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 + c 2 ) · f = (c 1 · f) + (c 2 · f)<br />

– per ogni c in R e per ogni f e g in N, si ha c · (f + g) = c · f + c · g<br />

– per ogni f in N, si ha 1 · f = f<br />

Un elemento dello spazio vettoriale prende il nome <strong>di</strong> vettore.<br />

Siano ora y 1 , y 2 , . . . , y n n elementi dello spazio vettoriale N. Si <strong>di</strong>ce combinazione lineare<br />

dei vettori y 1 , y 2 , . . . , y n me<strong>di</strong>ante i coefficienti c 1 , c 2 , . . . , c n <strong>di</strong> R, il vettore dato da<br />

c 1 y 1 + c 2 y 2 + . . . c n y n .<br />

Gli n vettori y 1 , y 2 , . . . , y n si <strong>di</strong>cono linearmente in<strong>di</strong>pendenti se l’unica combinazione<br />

lineare dei vettori y 1 , y 2 , . . . , y n che produce il vettore nullo è data da coefficienti tutti nulli:<br />

c 1 y 1 + c 2 y 2 + . . . c n y n = 0 ⇐⇒ c 1 = c 2 = . . . = c n = 0<br />

Se uno spazio vettoriale ha n vettori linearmente in<strong>di</strong>pendenti allora si <strong>di</strong>ce che lo spazio<br />

ha <strong>di</strong>mensione n. I vettori linearmente in<strong>di</strong>pendenti costituiscono una base dello spazio.<br />

Ogni funzione dello spazio può essere ottenuta me<strong>di</strong>ante una combinazione lineare della<br />

base, cioè dei suoi vettori linearmente in<strong>di</strong>pendenti.<br />

129


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

8.9 L’equazione omogenea<br />

Torniamo all’equazione <strong>di</strong>fferenziale omogenea L(y) = 0 e cerchiamo <strong>di</strong> caratterizzare le<br />

sue soluzioni.<br />

Sia L(y) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y e sia data l’equazione <strong>di</strong>fferenziale<br />

L(y) = 0.<br />

Siano y 1 , y 2 , . . . , y n n integrali particolari, per x ∈ [a, b], dell’equazione <strong>di</strong>fferenziale omogenea.<br />

Per capire se questi integrali sono linearmente in<strong>di</strong>pendenti, abbiamo bisogno <strong>di</strong> introdurre<br />

il cosiddetto determinante wronskiano o, semplicemente, il wronskiano delle funzioni<br />

y 1 , y 2 , . . . , y n , che è dato dalla funzione w(x) definita per x ∈ [a, b] me<strong>di</strong>ante il determinante<br />

y 1 (x) y 2 (x) . . . y n (x)<br />

y 1(x) ′ y 2(x) ′ . . . y ′ n(x)<br />

w(x) =<br />

y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />

′′<br />

. . . . . .<br />

∣y (n−1)<br />

1 (x) y (n−1)<br />

2 (x) . . . y n<br />

(n−1) (x) ∣<br />

Teorema 8.9.1 Sia dato l’operatore L definito tramite le n funzioni a 0 (x), a 1 (x), . . . , a n−1 (x),<br />

continue in un intervallo aperto ]a, b[⊂ R. Siano y 1 (x), y 2 (x), . . . , y n (x) n funzioni <strong>di</strong>verse da zero<br />

che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale:<br />

L(y 1 ) = L(y 2 ) = · · · = L(y n ) = 0<br />

Con<strong>di</strong>zione necessaria e sufficiente affinchè le n soluzioni siano linearmente in<strong>di</strong>pendenti è<br />

che sia <strong>di</strong>verso da zero per ogni valore <strong>di</strong> x ∈]a, b[, il wronskiano w(x).<br />

Teorema 8.9.2 Lo spazio delle funzioni che sono soluzione dell’equazione omogenea L(y) = 0<br />

(lo spazio nullo N) ha <strong>di</strong>mensione n, ovvero, l’equazione omogenea L(y) = 0 ammette sempre<br />

un sistema <strong>di</strong> n integrali linearmente in<strong>di</strong>pendenti.<br />

Dimostrazione.<br />

Si fissi x 0 ∈ R e si considerino gli n problemi <strong>di</strong> Cauchy<br />

(1)L(y) = 0, y(x 0 ) = 1, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />

(2)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 1, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />

(3)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 1, . . . y (n−1) (x 0 ) = 0<br />

.<br />

(n)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 1<br />

Quin<strong>di</strong> l’i-mo problema <strong>di</strong> Cauchy ha con<strong>di</strong>zioni iniziali tutte nulle, eccetto la derivata<br />

y (i−1) che in x 0 vale 1.<br />

Per ciascuno <strong>di</strong> questi problemi <strong>di</strong> Cauchy, la soluzione esiste ed è unica (per il teorema<br />

<strong>di</strong> esistenza e unicità visto prima).<br />

Consideriamo ora il wronskiano delle n funzioni y i (per i = 1, 2, . . . , n) che sono soluzioni<br />

<strong>di</strong> questi problemi <strong>di</strong> Cauchy:<br />

130<br />

w(x) =<br />

∣<br />

y 1 (x) y 2 (x) . . . y n (x)<br />

y 1(x) ′ y 2(x) ′ . . . y n(x)<br />

′ y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />

′′<br />

. . . . . .<br />

1 (x) y (n−1)<br />

2 (x) . . . y n<br />

(n−1) (x) ∣<br />

y (n−1)


8.10. L’equazione non omogenea<br />

Valutiamo w(x) per x = x 0 . Si ha<br />

1 0 . . . 0<br />

0 1 . . . 0<br />

w(x 0 ) =<br />

. . . . . .<br />

∣0 0 . . . 1∣<br />

Risulta che w(x 0 ) è il determinante della matrice identità, che ha uno sugli elementi della<br />

<strong>di</strong>agonale principale e zero altrove. Il determinante <strong>di</strong> questa matrice vale 1, quin<strong>di</strong> è <strong>di</strong>verso<br />

da zero.<br />

Poichè x 0 è stato scelto in modo arbitrario in R, vuole <strong>di</strong>re che le n soluzioni dell’equazioni<br />

<strong>di</strong>fferenziali sono linearmente in<strong>di</strong>pendenti (in base al teorema 8.9.1).<br />

Abbiamo trovato dunque n funzioni linearmente in<strong>di</strong>pendenti che risolvono l’equazione<br />

omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni<br />

dell’equazione L(y) = 0. ✔<br />

Definizione 8.9.1 Una n-pla <strong>di</strong> funzioni y 1 , y 2 , . . . , y n che sono soluzioni linearmente in<strong>di</strong>pendenti<br />

<strong>di</strong> L(y) = 0 prende il nome <strong>di</strong> sistema fondamentale <strong>di</strong> integrali <strong>di</strong> L(y) =<br />

0.<br />

Se conosciamo n soluzioni linearmente in<strong>di</strong>pendenti <strong>di</strong> L(y) = 0, la generica soluzione<br />

<strong>di</strong> L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente in<strong>di</strong>pendenti.<br />

Questa generica soluzione prende il nome <strong>di</strong> integrale generale. Si ha il seguente teorema<br />

Teorema 8.9.3 (Sull’integrale generale <strong>di</strong> un’equazione omogenea) Dato un sistema fondamentale<br />

<strong>di</strong> integrali y 1 , y 2 , . . . , y n dell’equazione <strong>di</strong>fferenziale omogenea L(y) = 0, l’integrale<br />

generale è dato dalle combinazioni lineari<br />

y = c 1 y 1 + c 2 y 2 + . . . c n y n<br />

con c 1 , c 2 , . . . , c n costanti <strong>di</strong> R.<br />

8.10 L’equazione non omogenea<br />

Sia data ora un’equazione <strong>di</strong>fferenziale non omogenea<br />

L(y) = b(x)<br />

.<br />

Sappiamo che ad essa possiamo associare l’equazione <strong>di</strong>fferenziale omogenea<br />

L(y) = 0<br />

Se conosciamo un integrale particolare dell’equazione non omogenea, y, e conosciamo<br />

l’integrale generale dell’equazione omogenea associata, y, allora l’integrale generale dell’equazione<br />

non omogenea, che in<strong>di</strong>chiamo con η, è dato dalla somma <strong>di</strong> y e <strong>di</strong> y. Vale infatti il<br />

seguente teorema.<br />

Teorema 8.10.1 Dato y integrale particolare <strong>di</strong> L(y) = b(x), e dato l’integrale generale y <strong>di</strong><br />

L(y) = 0, allora l’integrale generale <strong>di</strong> L(y) = b(x) è dato da<br />

η = y + y<br />

131


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Dimostrazione.<br />

Consideriamo η = y + y. Si ha<br />

L(η) = L(y + y)<br />

applicando la linearità <strong>di</strong> L<br />

= L(y) + L(y)<br />

ma L(y) = 0 e L(y) = b(x)<br />

= b(x)<br />

Quin<strong>di</strong> η è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />

Supponiamo che y ∗ sia un altro integrale particolare <strong>di</strong>verso da y, per l’equazione non<br />

omogenea, L(y ∗ ) = b(x), allora y ∗ = y ∗ − y risulta un integrale dell’omogenea associata, in<br />

quanto<br />

L(y ∗ ) = L(y ∗ − y) = L(y ∗ ) − L(y) = b(x) − b(x) = 0<br />

Quin<strong>di</strong> y ∗ si può scrivere come combinazione lineare <strong>di</strong> un sistema fondamentale <strong>di</strong> integrali<br />

dell’equazione omogenea, tramite dei coefficienti c 1 , c 2 , . . . , c n . Perciò y ∗ = y ∗ + y rientra come<br />

caso particolare (perchè y ∗ è caratterizzato da specifici coefficienti) dell’integrale generale<br />

η = y + y, cioè η = y + y è l’unico modo per rappresentare l’integrale generale dell’equazione<br />

non omogenea. ✔<br />

Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale L(y) = b(x), conoscendo n integrali<br />

linearmente in<strong>di</strong>pendenti dell’equazione omogenea associata, e un integrale particolare y<br />

della non omogenea, è dato da dato da<br />

y = c 1 y 1 + c 2 y 2 + . . . , c n y n + y<br />

8.11 Equazioni lineari a coefficienti costanti<br />

Data l’equazione <strong>di</strong>fferenziale<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

se a 0 (x) ≡ a 0 , a 1 (x) ≡ a 1 , . . . , a n−1 (x) = a n−1 , tutte le funzioni sono costanti in x, allora<br />

l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale a coefficienti costanti:<br />

y (n) + a n−1 y (n−1) + . . . + a 1 y ′ + a 0 y = b(x)<br />

Per trovare l’integrale generale dell’equazione lineare a coefficienti costanti, si considera<br />

la cosiddetta equazione caratteristica, che si ricava dall’equazione <strong>di</strong>fferenziale omogenea<br />

associata, sostituendo alle derivate della funzione incognita le potenze della variabile z:<br />

P (z) = z n + a n−1 z n−1 + . . . + a 1 z + a 0 = 0<br />

Quin<strong>di</strong> a y (n) sostituiamo z n , a y (n−1) sostituiamo z n−1 m fino ad arrivare a y che sostituiamo<br />

con z 0 = 1. Il polinomio P (z) prende il nome <strong>di</strong> polimonio caratteristico. Si cercano le ra<strong>di</strong>ci<br />

del polinomio caratteristico, cioè i valori <strong>di</strong> z per cui P (z) = 0 e da queste ra<strong>di</strong>ci è possibile<br />

risalire (vedremo ora in che modo) all’integrale generale dell’equazione <strong>di</strong>fferenziale lineare<br />

omogenea. Occorre poi trovare un integrale particolare per l’equazione non omogenea.<br />

Ricor<strong>di</strong>amo che un polinomio <strong>di</strong> grado n ammette n ra<strong>di</strong>ci: queste ra<strong>di</strong>ci possono essere<br />

reali o complesse, e possono essere con molteplicità semplice o <strong>di</strong> un certo grado, ma tali<br />

che la somma dei gra<strong>di</strong> <strong>di</strong> ciascuna ra<strong>di</strong>ce <strong>di</strong>a il grado del polinomio. Ve<strong>di</strong>amo dei semplici<br />

esempi.<br />

132


8.11. Equazioni lineari a coefficienti costanti<br />

Esempio<br />

Es. 8.11.1 Consideriamo un polinomio <strong>di</strong> secondo grado. Sappiamo che, dato un polinomio<br />

<strong>di</strong> secondo grado P (z) = az 2 + bz + c, per trovare le ra<strong>di</strong>ci del polinomio, cioè quei<br />

valori <strong>di</strong> z per cui P (z) = 0 si ha la formula z = −b ± √ b 2 − 4ac<br />

, dove la quantità sotto<br />

2a<br />

ra<strong>di</strong>ce, b 2 − 4ac prende il nome <strong>di</strong> <strong>di</strong>scrimante e viene in<strong>di</strong>cato con il simbolo ∆.<br />

GSe ∆ = b 2 − 4ac > 0 si hanno due ra<strong>di</strong>ci reali <strong>di</strong>stinte.<br />

Esempio: P (z) = z 2 − 5z − 6.<br />

In questo caso ∆ = 25 + 24 = 49, da cui z = 5 ± 7<br />

2 . Si hanno due ra<strong>di</strong>ci <strong>di</strong>stinte: z 1 = 6 e<br />

z 2 = −1.<br />

GSe ∆ = b 2 − 4ac = 0 si hanno due ra<strong>di</strong>ci reali coincidenti (una ra<strong>di</strong>ce da contarsi due<br />

volte, o con molteplicità due).<br />

Esempio: P (z) = z 2 − 2z + 1. Qui ∆ = 4 − 4 = 0. Si ricava facilmente, o applicando la<br />

formula, o riconoscendo che P (z) = (z − 1) 2 , che la ra<strong>di</strong>ce è z = 1 da contarsi due volte,<br />

cioè z = 1 è una ra<strong>di</strong>ce con molteplicità doppia.<br />

GSe ∆ = b 2 − 4ac < 0, non si hanno ra<strong>di</strong>ci reali ma nel campo complesso, introducendo<br />

l’unità immaginaria i = √ −1, per cui √ b 2 − 4ac = √ (−1)(4ac − b 2 ) = i √ 4ac − b 2 , essendo<br />

ora 4ac − b 2 > 0.<br />

Esempio: P (z) = z 2 + 2z + 3. In questo caso ∆ = 4 − 12 = −8 Sotto ra<strong>di</strong>ce ho −8, quin<strong>di</strong> le<br />

ra<strong>di</strong>ci sono complesse.<br />

z = −2 ± i2√ 2<br />

2<br />

= −1 ± i √ 2<br />

Trovo due ra<strong>di</strong>ci z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2.<br />

Queste due ra<strong>di</strong>ci sono complesse e coniugate, perchè la parte immaginaria delle due<br />

ra<strong>di</strong>ci è una l’opposta dell’altra.<br />

Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i<br />

l’unità immaginaria. Il coniugato <strong>di</strong> z = a + ib è dato da z = a − ib.<br />

Per determinare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale omogenea si vanno a<br />

cercare le ra<strong>di</strong>ci del polinomio caratteristico. Supponiamo che il polimonio caratteristico<br />

abbia n ra<strong>di</strong>ci reali tutte <strong>di</strong>stinte tra <strong>di</strong> loro, γ 1 , γ 2 , . . . , γ n , allora le funzioni y(x) = e γix<br />

sono soluzioni particolari dell’equazione <strong>di</strong>fferenziale. Infatti da y(x) = e γx si ha y ′ = γe γx ,<br />

y ′′ = γ 2 e γx , . . . , y (n) = γ n e γx . Se an<strong>di</strong>amo a sostituire nell’equazione <strong>di</strong>fferenziale, ricaviamo<br />

L(y) = L(e γx )<br />

= γ n e γx + a n−1 γ n−1 e γx + . . . + a 1 γe γx + a 0 e γx<br />

metto in evidenza e γx<br />

= (γ n + a n−1 γ n−1 + . . . + a 1 γ + a 0 )e γx<br />

= P (γ)e γx<br />

ma γ è ra<strong>di</strong>ce dell’equazione caratteristica<br />

= 0<br />

Quin<strong>di</strong> y = e γx è soluzione dell’equazione <strong>di</strong>fferenziale lineare omogenea.<br />

In genere, però, un polinomio <strong>di</strong> grado n può avere ra<strong>di</strong>ci reali che si ripetono (che hanno<br />

una certa molteplicità), o ra<strong>di</strong>ci reali insieme a ra<strong>di</strong>ci complesse e coniugate (e anche queste<br />

ra<strong>di</strong>ci possono avere una certa molteplicità).<br />

Per ricavare l’integrale generale <strong>di</strong> un’equazione lineare omogenea, viene in aiuto il<br />

seguente teorema.<br />

133


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Teorema 8.11.1 Siano γ 1 , γ 2 , . . . , γ h h ra<strong>di</strong>ci reali del polinomio caratteristico, ciascuna delle<br />

quali ha rispettivamente molteplicità r 1 , . . . , r h mentre siano α 1 ± iβ 1 , α 2 ± iβ 2 , . . . , α l ± iβ k 2k<br />

ra<strong>di</strong>ci complesse e coniugate con molteplicità, rispettivamente, s 1 , s 2 , . . . , s k .<br />

La molteplicità delle ra<strong>di</strong>ci è tale che r 1 + r 2 + . . . + r h + 2(s 1 + s 2 + . . . + s k ) = n.<br />

Allora le n funzioni<br />

e γpx , xe γpx , . . . x rp−1 e γpx , per p = 1, 2, . . . , h<br />

e αqx cos (β q x), e αqx sin (β q x), xe αqx cos (β q x), xe αqx sin (β q x), . . . ,<br />

x sq−1 e αqx cos (β q x), x sq−1 e αqx sin (β q x), per q = 1, 2, . . . , k<br />

sono n soluzioni reali dell’equazione <strong>di</strong>fferenziale omogenea linearmente in<strong>di</strong>pendenti.<br />

Scritto in forma meno compatta, vuol <strong>di</strong>re che se l’equazione caratteristica ha n ra<strong>di</strong>ci,<br />

in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si<br />

hanno le seguenti soluzioni per l’equazione lineare:<br />

G dalle ra<strong>di</strong>ci reali del polinomio caratteristico si hanno i seguenti integrali:<br />

e γ1x xe γ1x x 2 e γ1x . . . x r1−1 e γ1x<br />

e γ2x xe γ2x x 2 e γ2x . . . x r2−1 e γ2x<br />

e γ3x xe γ3x x 2 e γ3x . . . x r3−1 e γ3x<br />

. . . . . . .<br />

e γ hx<br />

xe γ hx<br />

x 2 e γ hx<br />

. . . x rh−1 e γ hx<br />

G dalle ra<strong>di</strong>ci complesse e coniugate del polinomio caratteristico si hanno i seguenti<br />

integrali:<br />

e α1x cos (β 1 x) e α1x sin (β 1 x) xe α1x cos (β 1 x) xe α1x sin (β 1 x)<br />

x 2 e α1x cos (β 1 x) x 2 e α1x sin (β 1 x) . . . . . .<br />

. . . . . . x s1−1 e α1x cos (β 1 x) x s1−1 e α1x sin (β 1 x)<br />

e α2x cos (β 2 x) e α2x sin (β 2 x) xe α2x cos (β 2 x) xe α2x sin (β 2 x)<br />

x 2 e α2x cos (β 2 x) x 2 e α2x sin (β 2 x) . . . . . .<br />

. . . . . . x s2−1 e α2x cos (β 2 x) x s2−1 e α2x sin (β 2 x)<br />

e α3x cos (β 3 x) e α3x sin (β 3 x) xe α3x cos (β 3 x) xe α3x sin (β 3 x)<br />

x 2 e α3x cos (β 3 x) x 2 e α3x sin (β 3 x) . . . . . .<br />

. . . . . . x s3−1 e α3x cos (β 3 x) x s3−1 e α3x sin (β 3 x)<br />

.<br />

.<br />

.<br />

.<br />

e αkx cos (β k x) e αkx sin (β k x) xe αkx cos (β k x) xe αkx sin (β k x)<br />

x 2 e αkx cos (β k x) x 2 e αkx sin (β k x) . . . . . .<br />

. . . . . . x sk−1 e αkx cos (β k x) x sk−1 e αkx sin (β k x)<br />

L’integrale generale è dato da una combinazione lineare <strong>di</strong> tutte queste soluzioni particolari.<br />

Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale omogenea è dato dalle combinazioni<br />

lineari delle soluzioni linearmente in<strong>di</strong>pendenti trovate.<br />

Esempio<br />

Es. 8.11.2 Sia data l’equazione lineare omogenea y ′′ − 4y = 0.<br />

L’equazione caratteristica è data da P (z) = z 2 − 4 = 0<br />

Le ra<strong>di</strong>ci <strong>di</strong> questa equazione sono date da z 1 = 2, z 2 = −2. Sono due ra<strong>di</strong>ci reali, con<br />

molteplicità uno.<br />

L’integrale generale dell’equazione <strong>di</strong>fferenziale è dunque dato da<br />

y(x) = c 1 e 2x + c 2 e −2x<br />

134


8.12. Metodo dei coefficienti indeterminati<br />

Esempio<br />

Es. 8.11.3 Sia ora y ′′ + 2y ′ + y = 0. Ora l’equazione caratteristica è data da P (z) =<br />

z 2 + 2z + 1 = 0, che ha come ra<strong>di</strong>ci z = −1 con molteplicità doppia.<br />

In tal caso l’integrale generale è dato da<br />

Esempio<br />

y(x) = c 1 e −x + c 2 xe −x<br />

Es. 8.11.4 Sia data l’equazione <strong>di</strong>fferenziale y ′′ + 2y ′ + 3 = 0. Adesso si ha, per l’equazione<br />

caratteristica, P (z) = z 2 + 2z + 3 = 0 che ha due ra<strong>di</strong>ci complesse e coniugate<br />

z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2. La parte reale è a = −1 la parte complessa è b = √ 2, quin<strong>di</strong><br />

l’integrale generale è<br />

y(x) = c 1 e −x cos ( √ 2x) + c 2 e −x sin ( √ 2x)<br />

Se, invece, interessa la soluzione generale dell’equazione <strong>di</strong>fferenziale non omogenea,<br />

dobbiamo trovare, oltre all’integrale generale dell’omogenea associata, anche un integrale<br />

particolare dell’equazione non omogenea visto che l’integrale generale è dato dalla somma<br />

dell’integrale generale dell’omogenea associata e dell’integrale particolare della non<br />

omogenea (in base al teorema 8.10.1).<br />

Il problema <strong>di</strong> trovare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale non omogenea<br />

L(y) = b(x) si riconduce alla soluzione <strong>di</strong> due problemi:<br />

1. trovare l’integrale generale dell’equazione omogenea associata L(y) = 0<br />

2. trovare un integrale particolare dell’equazione non omogenea L(y) = b(x)<br />

8.12 Metodo dei coefficienti indeterminati<br />

Per alcune funzioni b(x) è possibile trovare l’integrale particolare in modo abbastanza<br />

semplice, applicando il cosiddetto metodo dei coefficienti indeterminati. Ecco un elenco <strong>di</strong><br />

possibili casi per b(x).<br />

G Sia b(x) = P (x), un polinomio <strong>di</strong> grado p. Se nell’equazione <strong>di</strong>fferenziale, a 0 ≠ 0 , allora<br />

come soluzione particolare si ha y = Q(x), dove Q(x) è un polinomio <strong>di</strong> grado al più<br />

p (si va a cercare un polinomio dello stesso grado del termine noto che sia soluzione<br />

particolare dell’equazione non omogenea).<br />

G Se b(x) = P (x) polinomio <strong>di</strong> grado p, ma a 0 = a 1 = . . . = a r−1 = 0 con r − 1 ≤ n − 1<br />

(ciò equivale a <strong>di</strong>re che nell’equazione caratteristica associata si ha la ra<strong>di</strong>ce z = 0 con<br />

molteplicità r) allora si ha come soluzione particolare y = x r Q(x) polinomio <strong>di</strong> grado al<br />

più p.<br />

G Sia b(x) = e αx P (x) con α ∈ R e P (x) polinomio <strong>di</strong> grado p,<br />

– Se α non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx Q(x), con Q(x) polinomio <strong>di</strong><br />

grado al più p.<br />

– Se α è ra<strong>di</strong>ce dell’eq. caratteristica, con molteplicità r, allora y = x r e αx Q(x) con<br />

Q(x) polinomio <strong>di</strong> grado al più p.<br />

G Sia b(x) = e αx cos(βx)P (x) oppure b(x) = e αx sin(βx)P (x) oppure b(x) = e αx (cos(βx) +<br />

sin(βx))P (x), con α, β ∈ R e P (x) polinomio <strong>di</strong> grado p<br />

– Se α ± iβ non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx (cos(βx)Q 1 (x) +<br />

sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />

– Se α ± iβ è ra<strong>di</strong>ce dell’eq. caratteristica con molteplicità r, allora y =<br />

x r e αx (cos(βx)Q 1 (x) + sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />

Se il termine noto b(x) è dato dalla somma <strong>di</strong> funzioni, ciascuna delle quali si può ricondurre<br />

ad uno dei casi descritti sopra, allora l’integrale particolare è dato dalla somma <strong>degli</strong><br />

integrali particolari delle equazioni <strong>di</strong>fferenziali non omogenee legate a ciascun addendo<br />

135


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

della funzione <strong>di</strong> partenza. Infatti, se il termine noto è dato dalla somma <strong>di</strong> m funzioni,<br />

b(x) = b 1 (x)+b 2 (x)+. . .+b m (x), possiamo considerare sia l’equazione <strong>di</strong>fferenziale L(y) = b(x),<br />

sia le m equazioni <strong>di</strong>fferenziali L(y) = b 1 (x), L(y) = b 2 (x), . . . L(y) = b m (x).<br />

Siano y 1 , y 2 , . . . , y m m soluzioni particolari <strong>di</strong> queste m equazioni <strong>di</strong>fferenziali, allora vale<br />

L(y 1 + y 2 + . . . y m ) = L(y 1 ) + L(y 2 ) + . . . + L(y m )<br />

b 1 (x) + b 2 (x) + . . . + b m (x)<br />

= b(x)<br />

Quin<strong>di</strong> y = y 1 + y 2 + . . . + y m è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi sulla risoluzioni <strong>di</strong> equazioni <strong>di</strong>fferenziali non omogenee.<br />

Esempio<br />

Es. 8.12.1 Si voglia risolvere l’equazione <strong>di</strong>fferenziale<br />

y ′′ + y = 3x 2<br />

Per prima cosa risolviamo l’omogenea associata y ′′ + y = 0. L’equazione caratteristica è :<br />

z 2 + 1 = 0, da cui z = ±i: abbiamo due ra<strong>di</strong>ci complesse e coniugate. L’integrale generale<br />

è, dunque: y = c 1 cos (x) + c 2 sin (x).<br />

Cerchiamo ora un integrale particolare. Ve<strong>di</strong>amo che b(x) = 3x 2 , è un polinomio <strong>di</strong> secondo<br />

grado, e il coefficiente a 0 dell’equazione <strong>di</strong>fferenziale è <strong>di</strong>verso da zero. Quin<strong>di</strong><br />

l’integrale particolare deve essere un polinomio <strong>di</strong> secondo grado, del tipo y = ax 2 +bx+c,<br />

con a, b, c da determinare andando a sostituire y nell’equazione <strong>di</strong>fferenziale. Infatti deve<br />

essere<br />

y ′′ + y = 3x 2<br />

Da y = ax 2 + bx + c, si ha y ′ = 2ax + b e y ′′ = 2a. Andando a sostituire nell’equazione<br />

<strong>di</strong>fferenziale si ricava:<br />

2a + ax 2 + bx + c = 3x 2<br />

Ora i termini che hanno le stesse potenze <strong>di</strong> x a primo e a secondo membro vanno<br />

eguagliati:<br />

⎧<br />

⎪⎨ ax 2 = 3x 2<br />

bx = 0<br />

⎪⎩<br />

2a + c = 0<br />

Risolviamo questo sistema <strong>di</strong> 3 equazioni in 3 incognite, ottenendo a = 3, b = 0, c = −2a =<br />

−6. Perciò l’integrale particolare è dato da y = 3x 2 − 6.<br />

L’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea vale dunque: y =<br />

c 1 cos (x) + c 2 sin (x) + 3x 2 − 6.<br />

Esempio<br />

Es. 8.12.2 Sia da risolvere l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = x + x 3 − e −x sin (2x)<br />

Per prima cosa cerchiamo le soluzioni dell’equazione omogenea associata. L’equazione<br />

caratteristica è : z 2 + 3z + 2 = 0, da cui le ra<strong>di</strong>ci reali z 1 = −1 e z 2 = −2. L’integrale<br />

generale dell’omogenea è dunque y = c 1 e −x + c 2 e −2x .<br />

136


8.12. Metodo dei coefficienti indeterminati<br />

Consideriamo ora il termine noto b(x) = x+x 3 −e −x sin (2x). Osserviamo come il termine<br />

noto possa essere visto come somma del polinomio P (x) = x + x 3 e della funzione<br />

−e −x sin (2x).<br />

Cerchiamo dunque un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = x + x 3<br />

e un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = −e −x sin (2x)<br />

Per il primo integrale, ve<strong>di</strong>amo che il termine noto è un polinomio <strong>di</strong> terzo grado e<br />

che il coefficiente a 0 ≠ 0, quin<strong>di</strong> l’integrale particolare è un polinomio <strong>di</strong> terzo grado<br />

y = ax 3 + bx 2 + cx + d. Derivando, si ha y ′ = 3ax 2 + 2bx + c e y ′′ = 6ax + 2b. Andando a<br />

sostituire nell’equazione <strong>di</strong>fferenziale si ha<br />

6ax + 2b + 3(3ax 2 + 2bx + c) + 2(ax 3 + bx 2 + cx + d) = x + x 3<br />

Raccogliendo i termini con le stesse potenze <strong>di</strong> x a primo membro, abbiamo<br />

2ax 3 + (9a + 2b)x 2 + (6a + 6b + 2c)x + 2b + 3c + 2d = x + x 3<br />

Uguagliando i termini con le stesse potenze a primo e a secondo membro si ha:<br />

⎧<br />

2a = 1<br />

⎪⎨<br />

9a + 2b = 0<br />

6a + 6b + 2c = 1<br />

⎪⎩<br />

2b + 3c + 2d = 0<br />

Otteniamo a = 1/2, b = − 9 2 a = −9 1 − 6a − 6b<br />

, c =<br />

4 2<br />

y = x3<br />

2 − 9 4 x2 + 23 4 x − 51<br />

8 .<br />

= 23 4<br />

, d =<br />

−2b − 3c<br />

2<br />

= − 51 , da cui<br />

8<br />

Passiamo ora a trovare un integrale particolare per la seconda equazione <strong>di</strong>fferenziale<br />

che abbiamo ricavato che ha come termine noto la funzione −e −x sin (2x). Riconducendoci<br />

allo schema che abbiamo fatto per i vari casi <strong>di</strong> termini noto, questo si<br />

riconduce alla funzione del tipo e αx sin (βx)P (x), dove α = −1, β = 2, P (x) = −1 (polinomio<br />

<strong>di</strong> grado 0). Poichè −1 ± i2 non è ra<strong>di</strong>ce dell’equazione caratteristica (che ha<br />

nel nostro caso solo ra<strong>di</strong>ci reali), dobbiamo cercare un integrale particolare del tipo<br />

y = e −x (cos (2x)a + sin (2x)b) (devono essere Q 1 eQ 2<br />

costanti).<br />

Allora,<br />

y ′ = −e −x (a cos (2x) + b sin (2x)) + e −x (−2a sin (2x) + 2b cos (2x))<br />

= e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))<br />

polinomi <strong>di</strong> grado zero, cioè delle<br />

y ′′ = −e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />

e −x (−2(2b − a) sin (2x) − 2(b + 2a) cos (2x))<br />

= e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))<br />

137


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Andando a sostituire nell’equazione <strong>di</strong>fferenziale, si ottiene:<br />

e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))+<br />

3(e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />

2(e −x (a cos (2x) + b sin (2x)) = −e −x sin (2x)<br />

Si può semplificare l’equazione <strong>di</strong>videndo ambo i membri per e −x .<br />

termini in sin (2x) e cos (2x) si ha:<br />

Raccogliendo i<br />

(2b − 4a) cos (2x) + (−4b − 2a) sin (2x) = − sin (2x)<br />

Quin<strong>di</strong>:<br />

{<br />

2b − 4a = 0<br />

−4b − 2a = −1<br />

Risolvendo il sistema si trova a = 1<br />

10 e b = 1 5 da cui y = e−x ( 1<br />

10 cos (2x) + 1 sin (2x)).<br />

5<br />

Concludendo, l’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea da cui<br />

siamo partiti è dato da:<br />

y = c 1 exp −x + c 2 exp −2x + x3<br />

2 − 9 4 x2 + 23 4 x − 51 8 + e−x ( 1<br />

10 cos (2x) + 1 sin (2x))<br />

5<br />

Se si ha un problema <strong>di</strong> Cauchy, si risolve prima l’equazione <strong>di</strong>fferenziale cercando un<br />

integrale generale. Successivamente, le costanti vengono determinate in base alle con<strong>di</strong>zioni<br />

iniziali date dal problema.<br />

138


CAPITOLO 9<br />

Forme <strong>di</strong>fferenziali<br />

Nel campo della matematica,<br />

se trovo un nuovo approccio a<br />

un problema, ci può essere<br />

sempre un altro matematico<br />

che sostiene <strong>di</strong> aver trovato<br />

una soluzione migliore, o<br />

semplicemente più elegante.<br />

Negli scacchi se qualcuno<br />

sostiene <strong>di</strong> essere più bravo <strong>di</strong><br />

me, io gli posso sempre dare<br />

scaccomatto.<br />

Emanuel Lasker (1868-1941)<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />

9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . . 144<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali<br />

Consideriamo una curva regolare γ nel piano data da equazioni parametriche<br />

x = x(t), y = y(t), a ≤ t ≤ b<br />

Sia data una funzione f(x, y) <strong>di</strong>pendente da due variabili. Possiamo pensare <strong>di</strong> integrare la<br />

funzione f sulla curva γ rispetto a x o rispetto a y (quin<strong>di</strong> non sull’arco <strong>di</strong> curva, ds, ma in<br />

dx o dy).<br />

Si ha l’integrale curvilineo <strong>di</strong> f rispetto a x dato da<br />

∫<br />

γ<br />

f(x, y)dx =<br />

∫ b<br />

a<br />

f(x(t), y(t))x ′ (t)dt<br />

Si ha l’integrale curvilineo <strong>di</strong> f rispetto a y dato da<br />

∫<br />

γ<br />

f(x, y)dy =<br />

∫ b<br />

a<br />

f(x(t), y(t))y ′ (t)dt<br />

139


9. FORME DIFFERENZIALI<br />

Infatti poichè x = x(t), allora dx = x ′ (t)dt. Analogo è il ragionamento per la y.<br />

Spesso questi due integrali appaiono insieme: se X e Y sono due funzioni nelle variabili<br />

x e y e se γ è una curva (data da equazioni parametriche come in precedenza), allora<br />

∫<br />

∫ b<br />

Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />

γ<br />

=<br />

=<br />

a<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

X(x(t), y(t))x ′ (t)dt + Y (x(t), y(t))y ′ (t)dt<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

L’espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome <strong>di</strong><br />

forma <strong>di</strong>fferenziale.<br />

Possiamo dare allora la seguente definizione<br />

Definizione 9.1.1 Date X e Y due funzioni definite in I ⊂ R 2 , si chiama forma <strong>di</strong>fferenziale<br />

lineare ω (o forma lineare) l’espressione<br />

ω = Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />

Le funzioni X e Y si chiamano coefficienti della forma <strong>di</strong>fferenziale.<br />

Se i coefficienti sono <strong>di</strong> classe C p , la forma <strong>di</strong>fferenziale si <strong>di</strong>ce <strong>di</strong> classe C p .<br />

Per una forma <strong>di</strong>fferenziale, si possono definire le seguenti operazioni:<br />

G dato un vettore r = (r 1 , r 2 ) e (x, y) ∈ I, il prodotto scalare tra ω e r è:<br />

ω · r = X(x, y)r 1 + Y (x, y)r 2<br />

G dato uno scalare c ∈ R e una funzione f definita in I e a valori in R si definisce la<br />

moltiplicazione della forma <strong>di</strong>fferenziale per c e per f nel modo seguente:<br />

cω = cXdx + cY dy<br />

fω = (fX)dx + (fY )dy<br />

G Date due forme <strong>di</strong>fferenziali ω 1 e ω 2 , si definisce ad<strong>di</strong>zione <strong>di</strong> ω 1 e <strong>di</strong> ω 2 la seguente<br />

forma:<br />

ω 1 + ω 2 = (X 1 dx + Y 1 dy) + (X 2 dx + Y 2 dy) = (X 1 + X 2 )dx + (Y 1 + Y 2 )dy<br />

Con queste operazione, l’insieme delle forme <strong>di</strong>fferenziali lineari, definite in un insieme I ⊂ R,<br />

è uno spazio vettoriale.<br />

Consideriamo, ora, il <strong>di</strong>fferenziale <strong>di</strong> una funzione f(x, y). Si ha df = f x dx+f y dy. Quin<strong>di</strong> il<br />

<strong>di</strong>fferenziale <strong>di</strong> una funzione f si può vedere come una forma <strong>di</strong>fferenziale lineare. Non vale,<br />

ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui<br />

<strong>di</strong>fferenziale coincida con la forma lineare stessa.<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali<br />

Abbiamo introdotto le forme <strong>di</strong>fferenziali introducendo <strong>degli</strong> integrali curvilinei fatti rispetto<br />

a x e rispetto a y. Le forme <strong>di</strong>fferenziali, infatti, vengono utilizzate in integrali<br />

curvilinei.<br />

Data una curva regolare γ con il suo orientamento naturale, quin<strong>di</strong> una curva +γ, che<br />

puó essere scritta in forma parametrica tramite le equazioni<br />

140<br />

x = x(t), y = y(t), a ≤ t ≤ b


9.2. Integrali delle forme <strong>di</strong>fferenziali<br />

si definisce integrale curvilineo (o <strong>di</strong> linea) della forma <strong>di</strong>fferenziale ω sulla curva +γ,<br />

l’integrale<br />

∫ ∫<br />

∫ b<br />

ω = Xdx + Y dy = (X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

+γ<br />

+γ<br />

a<br />

Se scriviamo le equazioni parametriche della curva usando una funzione vettoriale f =<br />

(x(t), y(t)), l’integrale <strong>di</strong> prima può essere scritto come<br />

∫ ∫ b<br />

ω = ω(f(t)) · f ′ (t)dt<br />

+γ<br />

a<br />

Difatti il prodotto scalare ω(f(t)) · f ′ (t) altro non è che la funzione integranda che abbiamo<br />

scritto prima X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t).<br />

Ora cerchiamo <strong>di</strong> vedere cosa succede se facciamo l’integrale <strong>di</strong> una forma <strong>di</strong>fferenziale<br />

su una curva +γ o sulla curva opposta −γ. Ve<strong>di</strong>amolo con un esempio.<br />

Esempio<br />

Es. 9.2.1 Sia ω = yx 2 dx + sin (πy)dy. Quin<strong>di</strong> X(x, y) = yx 2 , e Y (x, y) = sin (πy).<br />

La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4).<br />

La curva +γ in forma parametrica può essere scritta come<br />

x = t, y = 2t + 2, 0 ≤ t ≤ 1<br />

Per t = 0 si ha (0, 2), per t = 1 si ha (1, 4).<br />

Calcoliamo ∫ +γω. Si ha<br />

∫<br />

+γ<br />

ω =<br />

=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

(<br />

y(t)x(t) 2 x ′ (t) + sin (πy(t))y ′ (t) ) ∫ 1<br />

(<br />

dt = (2t + 2)t 2 + sin (π(2t + 2))2 ) dt<br />

(<br />

2t 3 + 2t 2 + 2 sin (π(2t + 2)) ) dt = 2 t4 4 + 2t3 3 − 1 π<br />

= 1 2 + 2 3 − 1 π + 1 π = 7 6<br />

0<br />

cos (π(2t + 2))|t=1 t=0<br />

Ve<strong>di</strong>amo ora cosa succede se integriamo lungo la curva opposta −γ (ricor<strong>di</strong>amo che quando<br />

abbiamo definito l’integrale curvilineo <strong>di</strong> una funzione lungo una curva γ, integrando<br />

lungo la curva, cioè rispetto all’ascissa curvilinea ds, abbiamo detto che l’integrale non<br />

<strong>di</strong>pende dall’orientamento della curva. In questo caso invece, le cose cambiano):<br />

La curva opposta −γ ha equazioni parametriche<br />

x = −t, y = −2t + 2, −1 ≤ t ≤ 0<br />

Per t = −1 si ha (1, 4), per t = 0 si ha (0, 2).<br />

Si ha dunque<br />

∫<br />

−γ<br />

ω =<br />

=<br />

∫ 0<br />

−1<br />

∫ 0<br />

−1<br />

yx 2 dx + sin (πy)dy =<br />

∫ 0<br />

−1<br />

(<br />

(−2t + 2)(−t) 2 (−1) + sin (π(−2t + 2))(−2) ) dt<br />

(<br />

2t 3 − 2t 2 − 2 sin (π(−2t + 2)) ) dt = 2 t4 4 − 2t3 3 − 1 π<br />

= − 1 π − 1 2 − 2 3 + 1 π = −7 6<br />

cos (π(−2t + 2))|t=0 t=−1<br />

Osserviamo dunque che il valore dell’integrale che abbiamo ottenuto sulla curva opposta<br />

−γ è l’opposto dell’integrale che avevamo ottenuto sulla curva +γ.<br />

141


9. FORME DIFFERENZIALI<br />

Vale infatti il seguente teorema<br />

Teorema 9.2.1 Data una forma <strong>di</strong>fferenziale ω e una curva regolare +γ si ha<br />

∫ ∫<br />

ω = − ω<br />

−γ<br />

+γ<br />

Dimostrazione. Dimostriamo questo teorema considerando che se una curva +γ è data<br />

da f = (x(t), y(t)) con a ≤ t ≤ b, la curva opposta si può scrivere come −γ con F = (˜x(t), ỹ(t)) =<br />

(x(−t), y(−t)) con −b ≤ t ≤ −a Quin<strong>di</strong> ˜x ′ (t) è uguale alla derivata della funzione x(−t) che va<br />

vista come la funzione composta x(h(t)) con h(t) = −t. Derivando, quin<strong>di</strong>, si ha la derivata <strong>di</strong><br />

x valutata in h(t) = −t per la derivata <strong>di</strong> h(t) che vale −1, da cui: ˜x ′ (t) = x ′ (−t)(−1) = −x ′ (−t).<br />

Analogamente, vale ỹ(−t) = −y ′ (−t).<br />

Allora<br />

∫ ∫ −a<br />

ω = (X(˜x(t), ỹ(t))˜x ′ (t) + Y (˜x(t), ỹ(t)), ỹ ′ (t)) dt<br />

−γ<br />

=<br />

=<br />

−b<br />

∫ −a<br />

−b<br />

∫ −a<br />

−b<br />

(X(x(−t), y(−t))(−x ′ (−t)) + Y (x(−t), y(−t)), (−y ′ (−t))) dt<br />

− (X(x(−t), y(−t))x ′ (−t) + Y (x(−t), y(−t))y ′ (−t)) dt<br />

facendo il cambiamento <strong>di</strong> variabili u = −t, du = −dt<br />

e considerando che per t = −b, u = b, e per t = −a, u = a<br />

=<br />

∫ a<br />

b<br />

∫ b<br />

= −<br />

∫<br />

= −<br />

(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />

a<br />

+γ<br />

(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />

ω<br />

✔<br />

Quin<strong>di</strong> nel fare gli integrali curvilinei delle forme <strong>di</strong>fferenziali occorre prestare molta attenzione<br />

all’orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme<br />

<strong>di</strong>fferenziali sono detti integrali orientati.<br />

Invece, anche per le forme <strong>di</strong>fferenziali, l’integrale curvilineo non <strong>di</strong>pende dal tipo <strong>di</strong><br />

rappresentazione utilizzata per la curva, cioè non <strong>di</strong>pende dalla scelta della rappresentazione<br />

parametrica.<br />

Si ha infatti la seguente proposizione<br />

Proposizione 9.2.1 L’integrale curvilineo ∫ ω non <strong>di</strong>pende dalla particolare rappresentazione<br />

della curva regolare<br />

+γ<br />

+γ.<br />

Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a ≤ t ≤ b o,<br />

in maniera equivalente, tramite la funzione F = (x F (u), y F (u)), con α ≤ u ≤ β . Sappiamo che,<br />

dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro me<strong>di</strong>ante<br />

una funzione φ : [α, β] ⇒ [a, b] con φ ′ (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f(φ(u))<br />

Torniamo all’integrale curvilineo. Da una parte<br />

∫<br />

+γ<br />

ω =<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

142


9.3. Applicazione delle forme <strong>di</strong>fferenziali<br />

Dall’altra si ha:<br />

∫ ∫ β<br />

ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />

+γ<br />

α<br />

Ma per la relazione che lega F a f si ha:<br />

F(u) = f(φ(u))<br />

(x F (u), y F (u)) = (x(φ(u), y(φ(u))<br />

+γ<br />

x ′ F (u) = x ′ (φ(u))φ ′ (u)<br />

y ′ F (u) = y ′ (φ(u))φ ′ (u)<br />

Quin<strong>di</strong> si ha<br />

∫ ∫ β<br />

ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />

=<br />

α<br />

∫ β<br />

α<br />

(X(x(φ(u)), y(φ(u)))x ′ (φ(u))φ ′ (u) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))φ ′ (u)) du<br />

mettendo in evidenza φ ′ (u)<br />

=<br />

∫ β<br />

α<br />

(X(x(φ(u)), y(φ(u)))x ′ (φ(u)) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))) φ ′ (u)du<br />

operando il cambiamento <strong>di</strong> variabili t = φ(u)<br />

e considerando dt = φ ′ (u)du<br />

e il cambiamento agli estremi u = α ⇒ t = a, u = β ⇒ t = b<br />

=<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

Abbiamo provato che la rappresentazione parametrica della curva non influisce sul risultato<br />

finale perchè gli integrali coincidono qualunque sia la rappresentazione parametrica per<br />

descrivere la stessa curva. ✔<br />

Per gli integrali curvilinei sulle forme <strong>di</strong>fferenziali valgono anche le seguenti proprietà:<br />

G se c ∈ R, ∫ +γ cω = c ∫ +γ ω<br />

G ∫ +γ ω 1 + ω 2 = ∫ +γ ω 1 + ∫ +γ ω 2<br />

G se la curva +γ viene sud<strong>di</strong>visa in un certo numero k <strong>di</strong> curve regolari, tali che +γ =<br />

+γ 1 ∪+γ 2 ∪. . .∪+γ k o se la curva è regolare a tratti, allora ∫ +γ ω = ∫ +γ 1<br />

ω+ ∫ +γ 2<br />

ω+. . .+ ∫ +γ k<br />

ω<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali<br />

In molte applicazioni soprattutto nella fisica, ci si trova a lavorare con funzioni vettoriali<br />

da integrare su curve. Sia F ⃗ = X(x, y)⃗i + Y (x, y)⃗j una funzione vettoriale (scritta in funzione<br />

dei versori <strong>degli</strong> assi x e y rispettivamente). Sia data una curva regolare +γ data da ⃗r =<br />

x(t)⃗i + y(t)⃗j (è la stessa cosa <strong>di</strong> scrivere f = (x(t), y(t)))) con a ≤ t ≤ b.<br />

Si definisce integrale curvilineo del vettore F ⃗ lungo la curva +γ l’integrale<br />

∫<br />

∫ b<br />

⃗F · d⃗r = ⃗F (⃗r) · ⃗r ′ (t)dt<br />

+γ<br />

a<br />

Poichè F ⃗ (⃗r) = F ⃗ (x(t), y(t)) = X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j e ⃗r ′ (t) = x ′ (t)⃗i + y ′ (t)⃗j, risulta<br />

∫<br />

∫ b<br />

⃗F · d⃗r = (X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j) · (x ′ (t)⃗i + y ′ (t)⃗j)dt<br />

+γ<br />

=<br />

a<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

143


9. FORME DIFFERENZIALI<br />

Abbiamo ritrovato la definizione <strong>di</strong> integrale curvilineo <strong>di</strong> una forma <strong>di</strong>fferenziale, dove i<br />

coefficienti della forma <strong>di</strong>fferenziale sono le componenti del vettore ⃗ F .<br />

Un esempio in cui ve<strong>di</strong>amo applicata una forma <strong>di</strong>fferenziale in fisica è il lavoro compiuto<br />

da un campo <strong>di</strong> forze. Se consideriamo una particella che si muove lungo una curva, in<strong>di</strong>cando<br />

con ⃗s la <strong>di</strong>stanza percorsa dalla particella lungo la curva +γ, e con ⃗ F = (X, Y ) una<br />

forza che agisce sulla particella mentre essa si sposta <strong>di</strong> d⃗s, si definisce lavoro elementare<br />

eseguito da ⃗ F il prodotto scalare:<br />

dL = ⃗ F · d⃗s<br />

In coor<strong>di</strong>nate cartesiane, e limitandoci al caso bi<strong>di</strong>mensionale, si può scrivere<br />

dL = Xdx + Y dy<br />

Il lavoro elementare è dunque una forma <strong>di</strong>fferenziale.<br />

Il lavoro totale lungo tutta la curva +γ è invece definito tramite l’integrale della forma<br />

<strong>di</strong>fferenziale dL:<br />

∫ ∫ b<br />

L = dL = X(x(t), y(t))dx + Y (x(t), y(t))dy<br />

+γ<br />

a<br />

9.4 Teorema fondamentale per gli integrali curvilinei<br />

Teorema 9.4.1 Assegnata una funzione f(x, y), si consideri la forma <strong>di</strong>fferenziale data dal<br />

suo <strong>di</strong>fferenziale: ω = df = f x dx + f y dy.<br />

Data una curva regolare +γ espressa me<strong>di</strong>ante rappresentazione parametrica da (x(t), y(t))<br />

(o me<strong>di</strong>ante la funzione vettoriale ⃗r) , si ha<br />

∫<br />

df = f(x(b), y(b)) − f(x(a), y(a))<br />

✔<br />

+γ<br />

Questo risultato equivale anche a <strong>di</strong>re che<br />

∫<br />

∇f · d⃗r = f(x(b), y(b)) − f(x(a), y(a))<br />

+γ<br />

Dimostrazione.<br />

Si ha<br />

∫ ∫ b<br />

df = (f x (x(t), y(t))x ′ (t) + f y (x(t), y(t))y ′ (t)) dt<br />

+γ<br />

a<br />

per le regole <strong>di</strong> derivazione delle funzioni composte<br />

=<br />

∫ b<br />

a<br />

df(x(t), y(t))<br />

dt<br />

dt<br />

= f(x(t), y(t))| t=b<br />

t=a<br />

= f(x(b), y(b)) − f(x(a), y(a))<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte<br />

Definizione 9.5.1 Una forma <strong>di</strong>fferenziale ω = Xdx + Y dy (definita in un insieme aperto e <strong>di</strong><br />

classe C 0 ) si <strong>di</strong>ce esatta se esiste almeno una funzione F (<strong>di</strong> classe C 1 ) tale che dF = ω vale a<br />

<strong>di</strong>re se F x = X e F y = Y .<br />

144


9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />

Figura 9.1: A, B e C sono esempi <strong>di</strong> insiemi connessi.<br />

Figura 9.2: L’insieme A costituito dall’unione dei tre insiemi non è un insieme connesso.<br />

Si <strong>di</strong>ce anche che F è una primitiva <strong>di</strong> ω.<br />

Ve<strong>di</strong>amo ora un particolare tipo <strong>di</strong> insieme che ci permette <strong>di</strong> stabilire alcune importanti<br />

proprietà per le forme <strong>di</strong>fferenziali, se definite su questi insiemi. Si tratta <strong>degli</strong> insiemi<br />

connessi.<br />

Definizione 9.5.2 Un insieme aperto A ⊂ R 2 si <strong>di</strong>ce connesso se, qualunque siano i punti P<br />

e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come<br />

estremi.<br />

Per funzioni definite su insiemi connessi vale questo Lemma.<br />

Lemma 9.5.1 Sia f una funzione <strong>di</strong> classe C 1 definita in un insieme aperto e connesso A <strong>di</strong><br />

R 2 . Se, per ogni (x, y) ∈ A risulta f x (x, y) = f y (x, y) = 0, allora f è una funzione costante in A.<br />

145


9. FORME DIFFERENZIALI<br />

Dimostrazione. Consideriamo due punti, P = (x, y) e P 0 = (x 0 , y 0 ) in A. Dalla definizione<br />

<strong>di</strong> insieme connesso, sappiamo che esiste una linea poligonale che congiunge P e P 0 e che<br />

si trova all’interno <strong>di</strong> A. Per semplicità supponiamo che la linea poligonale sia il segmento<br />

congiungente i due punti. Allora, per il teorema <strong>di</strong> Lagrange, si ha<br />

f(P ) = f(P 0 ) + f x (Q)(x − x 0 ) + f y (Q)(y − y 0 )<br />

con Q punto che non conosciamo, che si trova sul segmento congiungente P e P 0 . Poichè<br />

f x (Q) = f y (Q) = 0 (e questo qualunque sia il punto Q), si ha<br />

f(P ) = f(P 0 )<br />

Possiamo variare il punto P , lasciando fisso P 0 ma avremo sempre lo stesso risultato, quin<strong>di</strong><br />

la funzione assume valore costante.<br />

Se, al posto <strong>di</strong> un segmento congiungente P e P 0 , abbiamo una linea spezzata, si ripete il<br />

ragionamento su ciascun segmento arrivando alla stessa conclusione. ✔<br />

Per le forme <strong>di</strong>fferenziali, vale il seguente lemma.<br />

Lemma 9.5.2 Se F e G sono primitive, <strong>di</strong> classe C 1 , definite in un insieme aperto e connesso,<br />

della stessa forma <strong>di</strong>fferenziale lineare ω, allora <strong>di</strong>fferiscono per una costante.<br />

Dimostrazione. Poichè, per ipotesi, F e G sono primitive <strong>di</strong> ω = Xdx + Y dy, vuol <strong>di</strong>re che<br />

F x = G x = X, F y = G y = Y . Consideriamo la funzione f = F − G. Questa funzione è definita<br />

in un insieme aperto e connesso (come la forma lineare) ed è <strong>di</strong> classe C 1 (essendolo F e G).<br />

Si ha f x = F x − G x = X − X = 0 e f y = F y − G y = Y − Y = 0, e questo qualunque sia (x, y) preso<br />

nell’insieme <strong>di</strong> definizione. Ma, allora, sono sod<strong>di</strong>sfatte le ipotesi del lemma precedente e<br />

quin<strong>di</strong> f è una funzione costante: f(x, y) = cost. Di conseguenza, F (x, y) − G(x, y) = cost, cioè<br />

F e G <strong>di</strong>fferiscono per una costante: F (x, y) = G(x, y) + cost. ✔<br />

Consideriamo ora i seguenti teoremi sulle forme <strong>di</strong>fferenziali lineari esatte.<br />

Teorema 9.5.1 Data ω = Xdx + Y dy una forma <strong>di</strong>fferenziale lineare, <strong>di</strong> classe C 0 e definita<br />

in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva <strong>di</strong> ω è del tipo<br />

F + cost con cost una costante.<br />

Dimostrazione. Se F è una primitiva <strong>di</strong> ω, la funzione G = F +cost è anch’essa primitiva,<br />

in quanto G x = F x = X e G y = F y = Y (poichè la derivata <strong>di</strong> una costante rispetto a x e a y<br />

vale zero).<br />

Supponendo <strong>di</strong> conoscere un’altra primitiva <strong>di</strong> ω, G, poichè si ha sempre G x = X e<br />

G y = Y , per il lemma precedente, si ha ancora che G e F <strong>di</strong>fferiscono per una costante,<br />

quin<strong>di</strong> G = F + cost. ✔<br />

L’insieme delle primitive <strong>di</strong> una forma <strong>di</strong>fferenziale lineare ω in un insieme aperto e connesso<br />

prende il nome <strong>di</strong> integrale indefinito, propriò perchè, nota una primitiva, tutte le altre<br />

<strong>di</strong>fferiscono per una costante.<br />

Teorema 9.5.2 Dato A ⊂ R 2 aperto e connesso e data una forma <strong>di</strong>fferenziale lineare ω <strong>di</strong><br />

classe C 0 in A, le seguenti proposizioni sono equivalenti:<br />

1. ω è esatta.<br />

2. Se P 0 e P sono due punti qualunque in A e +γ 1 e +γ 2 sono due curve generalmente<br />

regolari orientate contenute in A, che hanno entrambe come primo estremo P 0 e come<br />

secondo estremo P , allora<br />

∫ ∫<br />

ω = ω<br />

+γ 1 +γ 2<br />

146<br />

vale a <strong>di</strong>re l’integrale curvilineo <strong>di</strong>pende solo dagli estremi P 0 e P e non dal cammino<br />

percorso.


9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />

Figura 9.3: Le curve +γ 1 e +γ 2 hanno gli stessi estremi P 0 e P . La curva −γ 2 opposta a +γ 2<br />

ha come estremi P e P 0 .<br />

3. Se γ è una qualunque curva generalmente regolare, chiusa e contenuta in A, allora<br />

∫<br />

ω = 0<br />

+γ<br />

Dimostrazione. Di questo teorema, <strong>di</strong>mostriamo che (1) ⇒ (2), (2) ⇒ (3) e (3) ⇒ (2).<br />

(1) ⇒ (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P 0 e P in A e<br />

sia +γ una curva generalmente regolare che ha P 0 come primo estremo e P come secondo<br />

estremo. In forma parametrica, le equazioni della curva +γ siano<br />

x = x(t) y = y(t) a ≤ t ≤ b<br />

Quin<strong>di</strong> (x(a), y(a)) = (x 0 , y 0 ) = P 0 , e (x(b), y(b)) = (x, y) = P .<br />

Sia F una primitiva <strong>di</strong> ω (esiste perchè ω è esatta: vuol <strong>di</strong>re che dF = ω, poichè F x = X e<br />

F y = Y .<br />

Ma allora per il teorema fondamentale del calcolo <strong>degli</strong> integrali (si veda teorema 9.4.1)<br />

∫ ∫<br />

ω = dF = F (P ) − F (P 0 )<br />

+γ<br />

+γ<br />

L’integrale non <strong>di</strong>pende dalla particolare curva +γ ma solo dagli estremi della curva e dalla<br />

primitiva F . Perciò, date due curve +γ 1 e +γ 2 il risultato dell’integrale non cambia (si veda<br />

Figura 9.3). La (2) è provata.<br />

(2) ⇒ (3) Sia +γ una curva generalmente regolare chiusa data da equazioni<br />

parametriche<br />

x = x(t) y = y(t) a ≤ t ≤ b<br />

Si fissi un punto t ′ interno all’intervallo [a, b] e si considerino le due curve che si ottengono<br />

da +γ facendo variare il parametro t in [a, t ′ ] e in [t ′ , b] in modo che +γ sia dato dall’unione<br />

<strong>di</strong> queste due curve, che chiamiamo, rispettivamente +γ 1 e +γ 2 . La curva +γ 1 ha come<br />

primo estremo P 0 e come secondo estremo il punto T = (x(t ′ ), y(t ′ ). La curva +γ 2 ha come<br />

primo estremo T e come secondo estremo P 0 (essendo la curva chiusa e quin<strong>di</strong> (x(a), y(a)) =<br />

(x(b), y(b))).<br />

La curva opposta a +γ 2 è la curva −γ 2 e ha, quin<strong>di</strong>, come primo estremo P 0 e come<br />

secondo estremo T .<br />

Dunque, le curve +γ 1 e −γ 2 hanno gli stessi estremi P 0 e T . Ora, per l’ipotesi (2) sappiamo<br />

che ∫ ∫<br />

ω = ω<br />

+γ 1 −γ 2<br />

147


9. FORME DIFFERENZIALI<br />

Ma sappiamo anche che<br />

∫ ∫<br />

ω = −<br />

−γ 2<br />

Quin<strong>di</strong><br />

∫ ∫<br />

ω = −<br />

+γ 1<br />

+γ 2<br />

ω<br />

+γ 2<br />

ω<br />

da cui<br />

∫ ∫<br />

ω + ω = 0<br />

+γ 1 +γ 2<br />

Torniamo all’integrale su tutta la curva +γ: poichè +γ = +γ 1 ∪ +γ 2 si ha<br />

∫<br />

ω =<br />

+γ<br />

∫<br />

ω +<br />

+γ 1<br />

∫<br />

ω<br />

+γ 2<br />

Ma la somma <strong>di</strong> questi due integrali vale zero, quin<strong>di</strong><br />

∫<br />

ω = 0<br />

+γ<br />

L’asserto è dunque provato.<br />

(3) ⇒ (2) Siano date due curve +γ 1 e +γ 2 due curve generalmente regolari che hanno<br />

gli stessi estremi P 0 e P . Allora la curva +γ 1 ∪ −γ 2 è una curva chiusa generalmente regolare.<br />

Per la (3) vale<br />

∫<br />

+γ 1∪−γ 2<br />

ω = 0<br />

Ma<br />

∫ ∫ ∫<br />

ω = ω +<br />

+γ 1∪−γ 2 +γ 1<br />

Quin<strong>di</strong><br />

∫ ∫<br />

ω + ω = 0<br />

+γ 1 −γ 2<br />

−γ 2<br />

ω<br />

da cui<br />

∫ ∫ ∫ ∫<br />

ω = − ω ⇒ ω = ω<br />

+γ 1 −γ 2 +γ 1 +γ 2<br />

Abbiamo verificato il punto (2).<br />

Per completare la <strong>di</strong>mostrazione del teorema, andrebbe <strong>di</strong>mostrato che (2) ⇒ (1). Poichè<br />

la <strong>di</strong>mostrazione è abbastanza complicata, la tralasciamo. ✔<br />

Come corollario si ha<br />

Proposizione 9.5.1 Siano A ⊂ R 2 un insieme aperto e connesso e ω una forma <strong>di</strong>fferenziale<br />

lineare <strong>di</strong> classe C 0 in A, con F primitiva. Allora, se +γ è una curva generalmente regolare e<br />

orientata contenuta in A, che ha come primo estremo P 0 e come secondo estremo P , si ha<br />

∫<br />

ω = F (P ) − F (P 0 )<br />

+γ<br />

Dimostrazione.<br />

precedente. ✔<br />

148<br />

Questo risultato lo abbiamo <strong>di</strong>mostrato al punto (1) ⇒ (2) del teorema


9.6. Le forme <strong>di</strong>fferenziali lineari chiuse<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse<br />

Definizione 9.6.1 Una forma <strong>di</strong>fferenziale lineare ω = Xdx + Y dy <strong>di</strong> classe C 1 in A, insieme<br />

aperto <strong>di</strong> R 2 , si <strong>di</strong>ce chiusa se per ogni punto P <strong>di</strong> A risulta<br />

∂X<br />

∂y = ∂Y<br />

∂x<br />

Teorema 9.6.1 Data ω = Xdx+Y dy una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in un insieme<br />

aperto A ⊂ R 2 , ω esatta =⇒ ω chiusa.<br />

Dimostrazione. Se ω è esatta, vuol <strong>di</strong>re che esiste una primitiva, F , tale che F x = X<br />

e F y = Y . Per ipotesi ω è <strong>di</strong> classe C 1 , cioè le derivate parziali <strong>di</strong> X e Y sono continue. Di<br />

conseguenza F è <strong>di</strong> classe C 2 (poichè le sue derivate parziali del secondo or<strong>di</strong>ne coincidono<br />

con le derivate parziali prime <strong>di</strong> X e Y ). Inoltre si ha<br />

∂F 2<br />

∂x∂y = ∂X<br />

∂y<br />

e<br />

∂F 2<br />

∂y∂x = ∂Y<br />

∂x<br />

Per il teorema <strong>di</strong> Schwartz, le derivate parziali miste <strong>di</strong> F coincidono,<br />

risulta<br />

∂X<br />

∂y = ∂Y<br />

∂x<br />

∂F 2<br />

∂x∂y = ∂F 2<br />

∂y∂x , quin<strong>di</strong><br />

L’asserto è provato. ✔<br />

Osserviamo che il viceversa non vale sempre. Si possono avere forme <strong>di</strong>fferenziali chiuse che<br />

non sono esatte.<br />

Per poter avere l’implicazione ω chiusa ⇒ ω esatta, la forma <strong>di</strong>fferenziale lineare deve<br />

essere definita in un insieme particolare. Introduciamo, perciò, la definizione <strong>di</strong> insieme<br />

semplicemente connesso.<br />

Definizione 9.6.2 Un sottoinsieme <strong>di</strong> R 2 , A aperto, si <strong>di</strong>ce semplicemente connesso se<br />

G è connesso<br />

G ogni curva generalmente regolare, chiusa e semplice contenuta in A è la frontiera <strong>di</strong> un<br />

insieme limitato contenuto in A.<br />

Dire che A è un insieme semplicemente connesso vuol <strong>di</strong>re che l’insieme è ”senza buchi“,<br />

in quanto ogni curva chiusa e semplice, generalmente regolare, può essere deformata con<br />

continuità fino a ridursi ad un singolo punto. Una corona circolare ha ”buchi“ e, infatti,<br />

non è semplicemente connesso. Il piano privato <strong>di</strong> un punto non è semplicemente connesso.<br />

L’interno <strong>di</strong> un cerchio è semplicemente connesso. La circonferenza non è semplicemente<br />

connesso.<br />

Teorema 9.6.2 Sia ω una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in A aperto e semplicemente<br />

connesso. Allora se ω è chiusa, ω è esatta.<br />

149


Bibliografia<br />

[1] DAWKINS, P. (2007), Calculus I, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[2] DAWKINS, P. (2007), Calculus II, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[3] DAWKINS, P. (2007), Calculus III, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[4] GUICHARD, D. (2012), Calculus, Late Trascendentals, Creative Commons Attribution<br />

Non-Commercial-ShareAlike License, https://www.whitman.edu/mathematics/<br />

multivariable_late/.<br />

[5] KEISLER, H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Commons<br />

Attribution Non-Commercial-ShareAlike License, http://www.math.wisc.edu/<br />

~Keisler/calc.html.<br />

[6] STEWAR T, J. (2003), Calculus, Thomson-Brooks/Cole.<br />

[7] STEWAR T, J. (2007), Calculus, Early Transcendentals, Thomson,Brooks/Cole.<br />

[8] STRANG, G. (1991), Calculus, Wellesley-Cambridge Press.<br />

[9] TRENCH, W. F. (2012), Introduction to Real Analysis, Free Hyperlinked E<strong>di</strong>tion 2.00,<br />

February 2012.<br />

151

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!