Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...
Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...
Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Annamaria Mazzia<br />
<strong>Note</strong> <strong>di</strong> <strong>Analisi</strong> <strong>Matematica</strong> 2<br />
Università <strong>degli</strong> Stu<strong>di</strong> <strong>di</strong> Padova<br />
corso <strong>di</strong> laurea in Ingegneria E<strong>di</strong>le-Architettura<br />
a.a. 2012-2013<br />
Questo lavoro è pubblicato sotto una Creative Commons Attribution-Noncommercial-No<br />
Derivative Works 2.5 Italy License,<br />
(http://creativecommons.org/licenses/by-nc-nd/2.5/it/)
In<strong>di</strong>ce<br />
In<strong>di</strong>ce<br />
iii<br />
1 Brevi richiami <strong>di</strong> analisi 1 1<br />
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />
1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />
1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . 2<br />
1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
2 Funzioni reali <strong>di</strong> più variabili 7<br />
2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />
2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . 9<br />
2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . 13<br />
3 Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni <strong>di</strong> più variabili 17<br />
3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . 21<br />
3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />
3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
4 Massimi e minimi 35<br />
4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />
4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />
4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . 47<br />
4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />
4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . 50<br />
iii
INDICE<br />
4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . 52<br />
5 Le curve 57<br />
5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />
5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />
5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />
5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />
5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />
5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />
5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />
5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />
5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />
5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />
5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />
5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />
5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . 79<br />
5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />
6 Superfici parametriche 83<br />
6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />
6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />
6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . 87<br />
6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . 87<br />
7 Integrali 91<br />
7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />
7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . 91<br />
7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . 92<br />
7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />
7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />
7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />
7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />
7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />
7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />
7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />
7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />
7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />
7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />
7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />
7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />
7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />
7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />
8 Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie 119<br />
8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />
8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />
8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . 122<br />
8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />
8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . 123<br />
iv
In<strong>di</strong>ce<br />
8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />
8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . 126<br />
8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />
8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />
8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />
8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />
8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . 132<br />
8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />
9 Forme <strong>di</strong>fferenziali 139<br />
9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />
9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />
9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />
9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . 144<br />
9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />
9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />
Bibliografia 151<br />
v
CAPITOLO 1<br />
Brevi richiami <strong>di</strong> analisi 1<br />
La teoria attrae la pratica<br />
come il magnete attrae il ferro.<br />
Carl Friedrich Gauss<br />
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />
1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />
1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . 2<br />
1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />
1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
1.1 Introduzione<br />
Quando si descrivono teoremi, si danno definizioni o, semplicemente, si <strong>di</strong>scute <strong>di</strong><br />
matematica, è abbastanza usuale prendere in prestito lettere dell’alfabeto greco.<br />
È importante, quin<strong>di</strong>, saperle riconoscere e chiamarle in maniera corretta:<br />
A α Alfa N ν Nu<br />
B β Beta Ξ ξ Xi<br />
Γ γ Gamma O o Omicron<br />
∆ δ Delta Π π Pi<br />
E ɛ Epsilon P ρ Rho<br />
Z ζ Zeta Σ σ Sigma<br />
H η Eta T τ Tau<br />
Θ θ Theta Υ υ Upsilon<br />
I ι Iota Φ φ Fi<br />
K κ Kappa X χ Chi<br />
Λ λ Lambda Ψ ψ Psi<br />
M µ Mu Ω ω Omega<br />
1.2 Identità trigonometriche<br />
Nel seguito introduciamo alcune formule trigonometriche, con la notazione:<br />
G sin (x) ≡ seno(x), cos (x) ≡ coseno(x),<br />
sin (x)<br />
G tan (x) ≡ tangente(x) =<br />
cos (x) , sec (x) ≡ secante(x) = 1<br />
cos (x) ,<br />
1
1. BREVI RICHIAMI DI ANALISI 1<br />
cos (−θ) = cos (θ)<br />
cos ( π 2<br />
− θ) = sin (θ)<br />
sin<br />
cos ( π 2<br />
+ θ) = − sin (θ)<br />
sin<br />
cos (π − θ) = − cos (θ)<br />
cos (π + θ) = − cos (θ)<br />
cos (θ + φ) = cos (θ) cos (φ) − sin (θ) sin (φ)<br />
sin (2θ) = 2 sin (θ) cos (θ)<br />
sin 2 (θ) + cos 2 (θ) = 1<br />
sin (−θ) = − sin (θ)<br />
( π<br />
2<br />
− θ) = cos (θ)<br />
( π<br />
2<br />
+ θ) = cos (θ)<br />
sin (π − θ) = sin (θ)<br />
sin (π + θ) = − sin (θ)<br />
sin (θ + φ) = sin (θ) cos (φ) + cos (θ) sin (φ)<br />
cos (2θ) = cos 2 (θ) − sin 2 (θ)<br />
tan 2 (θ) + 1 = sec 2 (θ)<br />
1.3 Regole su funzione esponenziale e logaritmica<br />
Assumiano a, b ∈ R, con a > 0 e b > 0. Si ha:<br />
1 x = 1<br />
a x+y = a x a y<br />
a xy = (a x ) y<br />
a log a (x) = x a 0 = 1<br />
a x−y = a x /a y<br />
a x b x = (ab) x<br />
log a (xy) = log a (x) + log a (y) log a (x/y) = log a (x) − log a (y)<br />
log a (x y ) = y log a (x)<br />
log a (a x ) = x<br />
log b (x) = log a (x)<br />
log a (b)<br />
b x = a x log a (b)<br />
1.4 Derivate e integrali<br />
Siano f e g due funzioni <strong>di</strong>pendenti dalla variabile reale x mentre c ∈ R sia una costante.<br />
In<strong>di</strong>chiamo la derivata <strong>di</strong> f con il simbolo df<br />
dx o me<strong>di</strong>ante f ′ . Si ha:<br />
d (cf)<br />
d x = cf ′ regola della costante<br />
d (f + g)<br />
= d f<br />
d x + d g<br />
d x<br />
regola della somma<br />
d x<br />
d (f/g)<br />
= f ′ g − fg ′<br />
d x g 2 regola del quoziente<br />
d (fg)<br />
d x = fg′ + f ′ g regola del prodotto<br />
d f r<br />
d x = rf r−1 f ′<br />
regola della potenza<br />
Tra le regole <strong>di</strong> integrazione, invece, ricor<strong>di</strong>amo quella <strong>di</strong> integrazione per parti:<br />
∫<br />
∫<br />
fg ′ dx = fg − f ′ g dx<br />
Diamo ora una tabella delle derivate e <strong>degli</strong> integrali delle funzioni più note (per gli integrali<br />
lasciamo fuori la costante <strong>di</strong> integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x),<br />
arccos(x) ≡ arcocoseno(x), cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), arccot(x) ≡,<br />
arcocotangente(x).<br />
2
1.5. Altri teoremi<br />
f f ′ f f ′<br />
1<br />
ln(x)<br />
e x e x<br />
x<br />
sin (x) cos (x) cos (x) − sin (x)<br />
1<br />
tan (x)<br />
cos 2 (x) (= sec2 (x)) cot (x) − 1<br />
sin 2 (x)<br />
1<br />
1<br />
1<br />
1<br />
tan (x)<br />
− cot (x)<br />
cos (x)<br />
cos (x)<br />
sin (x)<br />
sin (x)<br />
1<br />
1<br />
arcsin (x) √ arccos (x) −√ 1 − x<br />
2<br />
1 − x<br />
2<br />
1<br />
arctan (x)<br />
1 + x 2 arccot(x) − 1<br />
1 + x 2<br />
f<br />
x r x r+1<br />
∫<br />
fd x f<br />
∫<br />
fd x<br />
r + 1 (r ≠ 1) x−1 ln |x|<br />
e x e x ln |x| x ln |x| − x<br />
sin (x) − cos (x) cos (x) sin (x)<br />
tan (x)<br />
1<br />
ln | |<br />
cos (x)<br />
cot (x) ln | sin (x)|<br />
1<br />
cos (x)<br />
1<br />
ln |<br />
cos (x) + tan (x)| 1<br />
sin (x)<br />
1<br />
ln | + cot (x)|<br />
sin (x)<br />
1<br />
cos 2 (x)<br />
tan (x)<br />
1<br />
sin 2 (x)<br />
− cot (x)<br />
tan (x)<br />
cos (x)<br />
1<br />
cos (x)<br />
cot (x)<br />
sin (x)<br />
− 1<br />
sin (x)<br />
arcsin (x) x arcsin (x) + √ 1 − x 2 arccos (x) x arccos (x) − √ 1 − x 2<br />
arctan (x) x arctan (x) − 1 2 ln (1 + x2 ) arccot(x) xarccot(x) − 1 2 ln (1 + x2 )<br />
1<br />
1<br />
√ arcsin (x)<br />
1 − x<br />
2<br />
1 + x 2 arctan (x)<br />
1.5 Altri teoremi<br />
Richiamiamo, nel seguito, alcuni teoremi.<br />
Utilizzeremo, inoltre, le seguenti notazioni per funzioni <strong>di</strong> una sola variabile definite in un<br />
insieme X ⊂ R. L’insieme delle funzioni continue in X verrà denotato con il simbolo C(X).<br />
L’insieme delle funzioni continue in X, che hanno le prime n derivate pure esse continue,<br />
sarà in<strong>di</strong>cato con C n (X).<br />
3
1. BREVI RICHIAMI DI ANALISI 1<br />
Teorema 1.5.1 (<strong>di</strong> Rolle) a<br />
Sia f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[.<br />
Se f(a) = f(b) = 0, allora esiste un punto<br />
ξ ∈]a, b[ tale che f ′ (ξ) = 0<br />
a Michel Rolle (1652- 1719) fu un matematico<br />
francese. È conosciuto per il teorema che porta il<br />
suo nome. Si deve a lui la notazione della ra<strong>di</strong>ce<br />
n-sima per mezzo del simbolo n√ x.<br />
Teorema 1.5.2 (del Valor Me<strong>di</strong>o) Sia<br />
f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[,<br />
allora esiste un punto ξ ∈]a, b[ tale che<br />
f ′ f(b) − f(a)<br />
(ξ) =<br />
b − a<br />
Teorema 1.5.3 (del Valore Interme<strong>di</strong>o)<br />
Sia f ∈ C([a, b]) e sia K un valore compreso<br />
tra f(a) e f(b). Allora esiste almeno un<br />
punto ξ ∈]a, b[ tale che f(ξ) = K.<br />
Quin<strong>di</strong> per funzioni continue, un valore compreso tra i due estremi dell’insieme <strong>di</strong><br />
definizione, è un valore assunto dalla funzione stessa (in uno o più punti).<br />
Come conseguenza <strong>di</strong> questo teorema, se f(a)f(b) < 0 (la funzione assume segno opposto<br />
agli estremi dell’intervallo [a, b]) allora esiste almeno un punto ξ tale che f(ξ) = 0, cioè esiste<br />
almeno una ra<strong>di</strong>ce dell’equazione f(x) = 0 nell’intervallo [a, b].<br />
Teorema 1.5.4 (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e<br />
tale che a ≤ g(x) ≤ b per ogni x ∈ [a, b], allora g ammette almeno un punto fisso.<br />
Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol <strong>di</strong>re che<br />
esiste almeno un punto ξ nel suo insieme <strong>di</strong> definizione, tale che g(ξ) = ξ.<br />
Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell’intervallo [a, b] e, in<br />
particolare a ≤ g(a) ≤ b e a ≤ g(b) ≤ b. Definiamo, perciò, la funzione continua Φ(x) me<strong>di</strong>ante<br />
la relazione<br />
Φ(x) = g(x) − x<br />
Allora Φ(a) = g(a) − a > 0 e Φ(b) = g(b) − b < 0. Per il Teorema del Valore Interme<strong>di</strong>o esiste<br />
almeno un punto ξ ∈]a, b[ tale che Φ(ξ) = 0, vale a <strong>di</strong>re g(ξ) − ξ = 0, cioè g(ξ) = ξ. Esiste<br />
almeno un punto fisso per la funzione g. ✔<br />
4
1.5. Altri teoremi<br />
Teorema 1.5.5 (Esistenza e unicità del punto fisso) Data una funzione g <strong>di</strong> classe C 1 in<br />
[a, b], con a ≤ g(x) ≤ b per ogni x ∈ [a, b], e con |g ′ (x)| ≤ m < 1 per ogni x ∈ [a, b] allora esiste ed è<br />
unico il punto fisso della g in tale intervallo.<br />
Dimostrazione. L’esistenza <strong>di</strong> almeno un punto fisso è assicurata dal teorema precedente<br />
(le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due<br />
punti fissi ξ e η, con ξ ≠ η, per la funzione g. Si ha<br />
|ξ − η| = |g(ξ) − g(η)|<br />
Applicando il teorema del Valor Me<strong>di</strong>o, esiste un punto c compreso tra ξ e η per cui<br />
|g(ξ) − g(η)| = |g ′ (c)(ξ − η)| ≤ |g ′ (c)||ξ − η|<br />
Ma per ipotesi |g ′ (c)| ≤ m < 1 da cui<br />
|ξ − η| ≤ m|ξ − η| < |ξ − η|<br />
Si arriva ad una contrad<strong>di</strong>zione. L’assurdo deriva dall’aver supposto ξ ≠ η. Quin<strong>di</strong> ξ = η e il<br />
punto fisso è unico. ✔<br />
Teorema 1.5.6 (del Valor Me<strong>di</strong>o del Calcolo Integrale) Se f ∈ C([a, b]) e g è integrabile in<br />
[a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ∈]a, b[ tale che<br />
∫ b<br />
a<br />
f(x)g(x) d x = f(ξ)<br />
∫ b<br />
a<br />
g(x) d x<br />
Per g ≡ 1, questo teorema ci dà il valore me<strong>di</strong>o della funzione f sull’intervallo [a, b], dato<br />
da f(ξ) = 1 ∫ b<br />
b − a<br />
a f(x) d x<br />
Teorema 1.5.7 (<strong>di</strong> Rolle generalizzato) Sia f ∈ C([a, b]) n volte <strong>di</strong>fferenziabile in ]a, b[. Se f<br />
si annulla in n + 1 punti <strong>di</strong>stinti x 0 , x 1 , . . . , x n in ]a, b[, allora esiste un punto ξ ∈]a, b[ in cui la<br />
derivata n-sima della f si annulla: f (n) (ξ) = 0.<br />
Teorema 1.5.8 (Formula <strong>di</strong> Taylor) 1<br />
Sia f ∈ C 2 ([a, b]) e sia x 0 un punto dell’intervallo [a, b]. Allora, per qualunque x ∈ [a, b] si può<br />
scrivere:<br />
f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />
f ′′ (ξ x )<br />
2<br />
dove ξ x è un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />
La formula appena scritta si <strong>di</strong>ce formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 nel punto x.<br />
La formula <strong>di</strong> Taylor appena scritta si può generalizzare se la funzione f è derivabile n + 1<br />
volte. Si ha così la formula polinomiale <strong>di</strong> Taylor <strong>di</strong> centro x 0 :<br />
dove<br />
f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />
2!<br />
R n (x) = f (n+1) (ξ x )<br />
(x − x 0 ) n+1<br />
(n + 1)!<br />
(x − x 0 ) 2 + . . . + f (n) (x 0 )<br />
(x − x 0 ) n + R n<br />
n!<br />
con ξ x un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />
1 Brook Taylor (1685 - 1731) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle<br />
<strong>di</strong>fferenze finite. L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne<br />
riconosciuta solo nel 1772 da Lagrange.<br />
5
CAPITOLO 2<br />
Funzioni reali <strong>di</strong> più variabili<br />
La facoltà che mette in moto<br />
l’invenzione matematica non è<br />
il ragionamento, bensì<br />
l’immaginazione.<br />
Augustus De Morgan<br />
(1806-1871)<br />
2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />
2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . . 9<br />
2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . . 13<br />
2.1 Lo spazio R n<br />
Dallo stu<strong>di</strong>o <strong>di</strong> funzioni reali <strong>di</strong> variabili reali f : R −→ R che alla variabile x ∈ R associa<br />
il valore f(x) ∈ R, passiamo a stu<strong>di</strong>are funzioni reali <strong>di</strong> più variabili: non c’è più una sola<br />
variabile x come variabile <strong>di</strong> input della nostra funzione, ma possiamo avere due o più<br />
variabili <strong>di</strong> input mentre il valore che assume la funzione rimane un valore reale (detto<br />
anche scalare).<br />
Se (x, y) è la coppia <strong>di</strong> variabili, ciascuna delle quali varia in R, possiamo definire una<br />
funzione f che alla coppia (x, y) associa il valore f(x, y).<br />
Analogamente, data la terna <strong>di</strong> variabili reali (x, y, z), si può definire una funzione f che,<br />
in corrispondenza <strong>di</strong> (x, y, z), assume il valore reale f(x, y, z),<br />
Il <strong>di</strong>scorso si può generalizzare con una n−nupla <strong>di</strong> valori (x 1 , x 2 , . . . , x n ) introducendo<br />
una funzione f che, per ogni n−nupla (x 1 , x 2 , . . . , x n ) associa il valore reale f(x 1 , x 2 , . . . , x n ).<br />
Introduciamo, dunque, lo spazio R n , dove n è un intero naturale, per definire lo spazio a<br />
n <strong>di</strong>mensioni.<br />
Un punto P ∈ R n è definito da una n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali (x 1 , x 2 , . . . , x n ).<br />
Ciascun valore x i , i = 1, 2, . . . , n, prende il nome <strong>di</strong> coor<strong>di</strong>nata i−sima del punto P . Data<br />
una funzione f definita in R n , possiamo scrivere f(x 1 , x 2 , . . . , x n ) o f(P ) per <strong>di</strong>re che stiamo<br />
valutando la funzione nel punto P .<br />
G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome<br />
<strong>di</strong> scalari.<br />
G Per n = 2 si ha lo spazio R 2 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y) (x<br />
prende il nome <strong>di</strong> ascissa del punto, mentre y è l’or<strong>di</strong>nata del punto).<br />
7
2. FUNZIONI REALI DI PIÙ VARIABILI<br />
Figura 2.1: Grafici delle tre funzioni f 1 , f 2 e f 3 .<br />
G Per n = 3 si ha lo spazio R 3 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y, z),<br />
rispettivamente ascissa, or<strong>di</strong>nata e quota del punto.<br />
Esempi <strong>di</strong> funzioni <strong>di</strong> più variabili in R 2 sono:<br />
G f 1 (x, y) = x + y<br />
G f 2 (x, y) = |x| + |y|<br />
G f 3 (x, y) = (x + y) cos (x + y)<br />
Di queste funzioni è possibile fare il grafico: così come una funzione reale <strong>di</strong> una variabile<br />
reale genera una curva nello spazio R 2 una funzione reale <strong>di</strong> due variabili reali genera una<br />
superficie nello spazio R 3 .<br />
Per il grafico <strong>di</strong> funzioni reali <strong>di</strong> tre o più variabili reali il <strong>di</strong>scorso si complica perchè<br />
va fatto in uno spazio che ha una <strong>di</strong>mensione in più rispetto a quello <strong>di</strong> partenza (che non<br />
riusciamo quin<strong>di</strong> a visualizzare). In tal caso il grafico genera un’ipersuperficie. Esempi <strong>di</strong><br />
funzioni reali in R 3 sono:<br />
G f 1 (x, y, z) = x 3 + xyz + y 2 + z<br />
G f 2 (x, y, z) = sin (xyz)<br />
G f 3 (x, y, z) = e x+y+z<br />
2.2 Definizioni preliminari<br />
Come per le funzioni <strong>di</strong> una sola variabile reale (funzioni scalari) sono stati definiti e<br />
analizzati i concetti <strong>di</strong> continuità, <strong>di</strong>fferenziabilità, limite, integrale e derivata, anche per le<br />
funzioni <strong>di</strong> più variabili possono essere fatti gli analoghi stu<strong>di</strong>.<br />
A tale scopo, dobbiamo introdurre alcune definizioni (che valgono in generale per uno<br />
spazio R n ma che noi vedremo poi in particolare per gli spazi R 2 e R 3 )<br />
Definizione 2.2.1 Si definisce funzione <strong>di</strong> n variabili reali una legge che assegna un unico<br />
numero reale f(x 1 , x 2 , . . . , x n ) ∈ R a ciascun punto (x 1 , x 2 , . . . , x n ) contenuto in un sottoinsieme<br />
D(f) <strong>di</strong> R n . L’insieme dei punti D(f) prende il nome <strong>di</strong> insieme <strong>di</strong> definizione o dominio della<br />
funzione f. L’insieme <strong>di</strong> tutti i numeri reali f(x 1 , x 2 , . . . , x n ) al variare dei punti nel dominio<br />
prende il nome <strong>di</strong> insieme dei valori o codominio della f (o range, per usare il termine matematico<br />
inglese) e si denota con R(f) oppure con f(A) se il dominio della funzione è stato in<strong>di</strong>cato<br />
con l’insieme A.<br />
Per in<strong>di</strong>care una funzione f si possono usare le seguenti scritture:<br />
f : D(f) −→ R(f) dove D(f) ⊂ R n , R(f) ⊂ R<br />
f : A −→ B dove A ⊂ R n , B ⊂ R, f(A) ⊂ B<br />
Per funzioni <strong>di</strong> una variabile reale, è usuale in<strong>di</strong>care la funzione con la notazione y = f(x),<br />
dal momento che il valore della funzione viene rappresentato sull’asse delle y nel piano<br />
8
2.2. Definizioni preliminari<br />
Figura 2.2: Rappresentazione grafica <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali f(x, y).<br />
cartesiano xy. Alla stessa maniera, è usuale in<strong>di</strong>care funzioni reali <strong>di</strong> due variabili reali<br />
me<strong>di</strong>ante la notazione z = f(x, y), visto che il valore <strong>di</strong> questa funzione viene rappresentato<br />
sull’asse delle z. Per quanto riguarda il grafico <strong>di</strong> una funzione f in R 2 , si può dare la<br />
seguente definizione:<br />
Definizione 2.2.2 Data una funzione f : D(f) −→ R(f) in R 2 , il grafico ad essa associato è<br />
dato dall’insieme<br />
{<br />
}<br />
G(f) = (x, y, z) ∈ R 3 : (x, y) ∈ D(f), z = f(x, y)<br />
In Figura 2.2 è rappresentato il grafico <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali, nello<br />
spazio R 2 . I valori della funzione sono rappresentati sull’asse delle z, dove in rosso è rappresentato<br />
l’insieme dei valori della funzione R(f), mentre sul piano xy, in blu, è rappresentato<br />
l’insieme <strong>di</strong> definizione D(f). Generalmente, il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili può<br />
essere o l’intero spazio R 2 o un suo sottoinsieme (come nella Figura 2.2).<br />
A volte, il dominio <strong>di</strong> una funzione non è specificato. Come capire qual è l’insieme dei<br />
punti per i quali la funzione f esiste Ci soffermiamo sul caso <strong>di</strong> una funzione definita in<br />
R 2 .<br />
2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili<br />
Come regola generale, se è data una funzione f(x, y) ma non vi è nessuna informazione sul<br />
dominio, allora il dominio sarà dato da tutti i punti del piano xy ad eccezione (o escludendo)<br />
quei punti (se ce ne sono) nei quali la funzione non può essere definita. Sono due le situazioni<br />
in cui una funzione f non può essere definita in un punto (x 0 , y 0 ): se il valore f(x 0 , y 0 ) non è<br />
un numero reale o se la funzione in (x 0 , y 0 ) assumerebbe valori ±∞.<br />
Ve<strong>di</strong>amo <strong>degli</strong> esempi.<br />
9
2. FUNZIONI REALI DI PIÙ VARIABILI<br />
(<br />
Figura 2.3: Grafico della funzione z = f(x, y) = 5 1 − x 4 − y )<br />
.<br />
8<br />
Esempio<br />
Es. 2.2.1 Sia data la funzione z = f(x, y) = x 3 + x 2 y. Questa funzione è ben definita per<br />
tutti i valori <strong>di</strong> x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre<br />
valori reali. Quin<strong>di</strong> f è definita in tutto R 2 .<br />
Esempio<br />
(<br />
Es. 2.2.2 Sia ora z = f(x, y) = 5 1 − x 4 − y )<br />
per 0 ≤ x ≤ 2 e per 0 ≤ y ≤ 8 − 4x.<br />
8<br />
In tal caso la funzione è assegnata su uno specifico dominio, quin<strong>di</strong>, anche se la funzione<br />
è ben definita per tutti i valori <strong>di</strong> x e <strong>di</strong> y, il dominio in cui va stu<strong>di</strong>ata, in questo esempio,<br />
è quello dato, vale a <strong>di</strong>re per x ∈ [0, 2], e per y che varia nell’intervallo [0, 8] quando x = 0,<br />
mentre y = 0 quando x = 2. Ciò significa che l’insieme <strong>di</strong> definizione è dato dal triangolo<br />
<strong>di</strong> estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3).<br />
Esempio<br />
Es. 2.2.3 Ve<strong>di</strong>amo ora la funzione z = f(x, y) = √ 16 − x 2 − y 2 .<br />
Questa funzione è ben definita solo quando l’espressione sotto ra<strong>di</strong>ce è non negativa.<br />
Perciò il suo dominio è dato dai punti (x,y) che sod<strong>di</strong>sfano la con<strong>di</strong>zione<br />
16 − x 2 − y 2 ≥ 0 ⇐⇒ x 2 + y 2 ≤ 16<br />
Questa con<strong>di</strong>zione definisce il dominio: si tratta del cerchio <strong>di</strong> centro l’origine e raggio 4<br />
nel piano xy. Infatti √ x 2 + y 2 è la definizione <strong>di</strong> <strong>di</strong>stanza <strong>di</strong> un punto (x, y) dall’origine<br />
del piano, da cui la con<strong>di</strong>zione x 2 + y 2 ≤ 16 è equivalente a √ x 2 + y 2 ≤ 4 ovvero l’insieme<br />
dei punti la cui <strong>di</strong>stanza dall’origine è minore o uguale a 4, vale a <strong>di</strong>re il cerchio <strong>di</strong> centro<br />
l’origine e raggio 4. Il grafico <strong>di</strong> questa funzione è una semisfera nel semipiano per z ≥ 0.<br />
10
2.2. Definizioni preliminari<br />
Esempio<br />
Es. 2.2.4 Sia z = f(x, y) = 10 . In tal caso, il dominio non è specificato ma ci accorgiamo<br />
subito che la funzione, per essere definita, deve avere il denominatore <strong>di</strong>verso da<br />
x − y<br />
zero. Quin<strong>di</strong> la funzione non è definita per x = y. Il dominio della f è dunque tutto il<br />
piano xy privato della retta x = y.<br />
Per poter andare avanti nello stu<strong>di</strong>o delle funzioni, dobbiamo riprendere o generalizzare<br />
altri concetti <strong>di</strong> base. Incominciamo dai vettori.<br />
2.2.2 Sui vettori<br />
Un punto P ∈ R n può essere visto anche come vettore <strong>di</strong> R n . Abbiamo infatti la seguente<br />
definizione<br />
Definizione 2.2.3 Un vettore <strong>di</strong> R n è un’n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali.<br />
Un vettore lo si in<strong>di</strong>ca me<strong>di</strong>ante il simbolo ⃗x. Quin<strong>di</strong> ⃗x è definito me<strong>di</strong>ante (x 1 , x 2 , . . . , x n ).<br />
Una funzione che generalizza ai vettori il valore assoluto <strong>di</strong> un numero reale prende il<br />
nome <strong>di</strong> norma. Esistono <strong>di</strong>versi tipi <strong>di</strong> norme. Noi consideriamo la norma euclidea e la<br />
chiameremo brevemente norma o modulo. Abbiamo la seguente definizione.<br />
Definizione 2.2.4 Dato un vettore ⃗x ∈ R n , si definisce modulo (o norma euclidea <strong>di</strong> ⃗x) la<br />
quantità scalare data da<br />
∑<br />
|⃗x| = √ n (x i ) 2<br />
i=1<br />
(con il simbolo ∑ n<br />
i=1 (x i) 2 in<strong>di</strong>chiamo la somma (x 1 ) 2 + (x 2 ) 2 + . . . (x n ) 2 ).<br />
Definizione 2.2.5 Dati due vettori ⃗x e ⃗y in R n si definisce <strong>di</strong>stanza tra i due vettori la quantità<br />
|⃗x − ⃗y|.<br />
Geometricamente, la <strong>di</strong>stanza tra due vettori non è altro che la <strong>di</strong>stanza euclidea tra due<br />
punti.<br />
Esempio<br />
Es. 2.2.5 Siano dati i due vettori ⃗p = (7, 1) e ⃗q = (3, 4). La <strong>di</strong>stanza tra i due vettori è<br />
data da<br />
|⃗p − ⃗q| = √ (7 − 3) 2 + (1 − 4) 2 = √ 16 + 9 = √ 25 = 5<br />
Se ve<strong>di</strong>amo i due vettori come i punti del piano P e Q che hanno coor<strong>di</strong>nate rispettivamente<br />
(7, 1) e (3, 4) e vogliamo calcolare la <strong>di</strong>stanza tra i due punti, dobbiamo applicare<br />
esattamente la stessa formula (si veda Figura 2.4).<br />
Quin<strong>di</strong> due punti nello spazio R n possono essere visti come vettori e viceversa. Di conseguenza,<br />
in R 2 o R 3 , quella che per noi è la <strong>di</strong>stanza tra due punti P e Q, e che ricaviamo<br />
applicando il teorema <strong>di</strong> Pitagora, può essere vista come la <strong>di</strong>stanza tra i due vettori.<br />
Presi due punti P e Q in R n possiamo fare P + Q o P − Q considerandoli come vettori e<br />
quin<strong>di</strong> sommando o facendo la <strong>di</strong>fferenza delle componenti omonime dei punti-vettori. Tutte<br />
le operazioni che possiamo fare tra vettori si ripetono tra punti.<br />
11
2. FUNZIONI REALI DI PIÙ VARIABILI<br />
Figura 2.4: Distanza tra due vettori ⃗p e ⃗q o <strong>di</strong>stanza tra due punti P e Q.<br />
Figura 2.5: A sinistra: somma e <strong>di</strong>fferenza tra punti in R 2 . A destra: prodotto <strong>di</strong> uno scalare<br />
per un punto. I vettori αQ, βQ, γQ e δQ sono messi sfalsati per ragioni pratiche <strong>di</strong> visibilità<br />
ma sono sulla stessa linea.<br />
Esempio<br />
Es. 2.2.6 Siano dati i due punti <strong>di</strong> R n , P (p 1 , p 2 , . . . , p n ) e Q(q 1 , q 2 , . . . , q n ) (usiamo questa<br />
notazione per rappresentare il punto P (o Q) <strong>di</strong> coor<strong>di</strong>nate (p 1 , p 2 , . . . , p n ) (o (q 1 , q 2 , . . . , q n )).<br />
Allora il punto P + Q ha componenti (p 1 + q 1 , p 2 + q 2 , . . . , p n + q n ), mentre il punto P − Q è<br />
dato da (p 1 − q 1 , p 2 − q 2 , . . . , p n − q n ).<br />
Dato uno scalare α, il punto αP è dato da (αp 1 , αp 2 , . . . , αp n ).<br />
Si veda Figura 2.5 per vedere l’interpretazione geometrica lavorando tra vettori.<br />
Definizione 2.2.6 Dati due vettori ⃗x e ⃗y, si definisce prodotto scalare tra i due vettori il numero<br />
reale in<strong>di</strong>cato con il simbolo ⃗x · ⃗y dato da<br />
12<br />
⃗x · ⃗y =<br />
n∑<br />
x i y i<br />
i=1
2.2. Definizioni preliminari<br />
Figura 2.6: Intervallo aperto ]a 1 , a 2 ]×]b 1 , b 2 [<br />
Figura 2.7: Esempio <strong>di</strong> insieme limitato in R 2 .<br />
2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera...<br />
Definizione 2.2.7 Dati due punti <strong>di</strong> R n , A (a 1 , a 2 , . . . , a n ) e B (b 1 , b 2 , . . . , b n ), con a i < b i (per<br />
i = 1, 2, . . . , n), si definisce intervallo aperto <strong>di</strong> R n <strong>di</strong> vertici A e B l’insieme dato da<br />
T = {P ∈ R n <strong>di</strong> coor<strong>di</strong>nate (x 1 , x 2 , . . . , x n ) t. c. a i < x i < b i , i = 1, 2, . . . , n}<br />
In R 2 un intervallo aperto <strong>di</strong> vertici A e B è dato dal rettangolo i cui punti (x, y) sono<br />
presi, rispettivamente, negli intervalli aperti ]a 1 , a 2 [ e ]b 1 , b 2 [, che possiamo in<strong>di</strong>care come<br />
]a 1 , a 2 ]×]b 1 , b 2 [ (si veda Figura 2.6)<br />
Definizione 2.2.8 I ⊂ R n si definisce insieme limitato <strong>di</strong> R n se esiste un intervallo aperto che<br />
lo contiene.<br />
Passiamo ora a considerare l’intorno <strong>di</strong> un punto. In R sappiamo che vale la seguente<br />
definizione.<br />
Definizione 2.2.9 Dato x 0 ∈ R e ɛ > 0, l’insieme dei punti x sull’asse reale che hanno <strong>di</strong>stanza<br />
da x 0 minore <strong>di</strong> ɛ è un intervallo aperto <strong>di</strong> centro x 0 e raggio ɛ che prende il nome <strong>di</strong> intorno <strong>di</strong><br />
13
2. FUNZIONI REALI DI PIÙ VARIABILI<br />
x 0 . Se in<strong>di</strong>chiamo con A ɛ (x 0 ) questo insieme, possiamo <strong>di</strong>re che<br />
A ɛ (x 0 ) = {x ∈ R : |x − x 0 | < ɛ}<br />
Generalizziamo questa definizione in R n .<br />
Definizione 2.2.10 Dato P 0 ∈ R n e ɛ > 0, l’insieme dei punti P <strong>di</strong> R n che hanno <strong>di</strong>stanza da<br />
P 0 minore <strong>di</strong> ɛ prende il nome <strong>di</strong> intorno circolare <strong>di</strong> centro P 0 e raggio ɛ.<br />
In<strong>di</strong>chiamo con A ɛ (P 0 ) questo insieme, possiamo <strong>di</strong>re che<br />
A ɛ (P 0 ) = {P ∈ R n : |P − P 0 | < ɛ}<br />
G In R 2 , considerando P 0 (x 0 , y 0 ), e il generico punto P (x, y) si ha<br />
{<br />
A ɛ (P 0 ) = P (x, y) ∈ R 2 : √ }<br />
(x − x 0 ) 2 + (y − y 0 ) 2 < ɛ<br />
Osserviamo che l’equazione<br />
(x − x 0 ) 2 + (y − y 0 ) 2 = ɛ 2<br />
rappresenta l’equazione <strong>di</strong> una circonferenza <strong>di</strong> centro il punto (x 0 , y 0 ) e raggio ɛ. Quin<strong>di</strong><br />
l’intorno <strong>di</strong> (x 0 , y 0 ) è dato da tutti i punti contenuti all’interno della circonferenza (nel<br />
cerchio), ma non i punti che si trovano sulla circonferenza.<br />
G In R 3 , preso P 0 (x 0 , y 0 , z 0 ) e considerato P (x, y, z) il generico punto <strong>di</strong> R 3 , si ha<br />
{<br />
A ɛ (P 0 ) = P (x, y, z) ∈ R 3 : √ }<br />
(x − x 0 ) 2 + (y − y 0 ) 2 + (z − z 0 ) 2 < ɛ<br />
Dal momento che l’equazione<br />
(x − x 0 ) 2 + (y − y 0 ) 2 + (−z 0 ) 2 = ɛ 2<br />
rappresenta l’equazione della sfera <strong>di</strong> centro P 0 e raggio ɛ, l’intorno <strong>di</strong> P 0 è dato da tutti<br />
i punti che si trovano all’interno della sfera ma non sulla superficie della sfera.<br />
Ve<strong>di</strong>amo ora altre definizioni che saranno utili nel seguito.<br />
Definizione 2.2.11 Dato I ⊂ R n :<br />
G Diremo che un punto P 0 ∈ R n è un punto <strong>di</strong> frontiera <strong>di</strong> I se ogni intorno <strong>di</strong> P 0 contiene<br />
almeno un punto <strong>di</strong> I e un punto che non appartiene a I.<br />
G Diremo che un punto P 0<br />
∈ R n è un punto interno <strong>di</strong> I se esiste un intorno <strong>di</strong> P 0 tutto<br />
contenuto in I.<br />
G Diremo che I è un insieme chiuso se ciascun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />
G Diremo che I è un insieme aperto se nessun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />
G L’insieme interno <strong>di</strong> I è l’insieme dei punti interni <strong>di</strong> I che non sono <strong>di</strong> frontiera <strong>di</strong> I.<br />
G L’insieme <strong>di</strong> frontiera <strong>di</strong> I è l’insieme <strong>di</strong> tutti i punti <strong>di</strong> frontiera <strong>di</strong> I.<br />
G L’insieme esterno <strong>di</strong> I è l’insieme dei punti che non sono <strong>di</strong> I e che non sono <strong>di</strong> frontiera<br />
<strong>di</strong> I.<br />
Definizione 2.2.12 Dato I ⊂ R n :<br />
G Diremo che P 0 ∈ R n è punto <strong>di</strong> accumulazione <strong>di</strong> I se per ogni intorno <strong>di</strong> P 0 ci sono infiniti<br />
punti che appartengono a I.<br />
G Diremo che P 0 ∈ I è punto isolato <strong>di</strong> I se non è punto <strong>di</strong> accumulazione per I.<br />
14<br />
Esempi:<br />
G L’intorno circolare <strong>di</strong> un punto P 0 , A ɛ (P 0 ) è un insieme aperto perchè nessun punto<br />
della frontiera appartiene ad esso.
2.2. Definizioni preliminari<br />
Figura 2.8: Esempio in R 2 <strong>di</strong> punti interni, <strong>di</strong> frontiera, <strong>di</strong> intorno <strong>di</strong> un punto.<br />
G L’insieme che denotiamo con il simbolo C ɛ (P 0 ), dato da<br />
C ɛ (P 0 ) = {P ∈ R n : |P − P 0 | ≤ ɛ}<br />
è un insieme chiuso perchè ciascun punto della frontiera appartiene ad esso.<br />
G Gli insiemi R n e ∅ sono sia insiemi chiusi sia insiemi aperti per convenzione.<br />
Definizione 2.2.13 Dato un insieme I ⊂ R n<br />
dall’unione <strong>di</strong> I e della sua frontiera.<br />
si definisce chiusura <strong>di</strong> I l’insieme formato<br />
Ad esempio, l’insieme C ɛ (P 0 ) rappresenta la chiusura <strong>di</strong> A ɛ (P 0 ).<br />
Definizione 2.2.14 Se I ⊂ R n è chiuso e limitato, esso si <strong>di</strong>ce compatto.<br />
15
CAPITOLO 3<br />
Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni<br />
<strong>di</strong> più variabili<br />
La mente che si apre ad una<br />
nuova idea non torna mai alla<br />
<strong>di</strong>mensione precedente.<br />
Albert Einstein (1879-1955)<br />
3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . 21<br />
3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />
3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />
Il concetto <strong>di</strong> limite <strong>di</strong> una funzione <strong>di</strong> più variabili è molto simile a quello per funzioni <strong>di</strong><br />
una sola variabile.<br />
Consideriamo una funzione <strong>di</strong> due variabili, f(x, y). Diciamo che il limite della funzione<br />
f(x, y) è L per (x, y) che tende a (x 0 , y 0 ) e scriviamo<br />
lim f(x, y) = L<br />
(x,y)→(x 0,y 0)<br />
se tutti i punti <strong>di</strong> un qualunque intorno <strong>di</strong> (x 0 , y 0 ) (senza considerare il punto (x 0 , y 0 )) appartengono<br />
al dominio della funzione e se f(x, y) tende a L quando (x, y) tende a (x 0 , y 0 ). Più<br />
vicino è il punto (x, y) a (x 0 , y 0 ), più il valore della funzione tende al valore del limite.<br />
Formalmente, la definizione è la seguente.<br />
Definizione 3.1.1 Siano dati una funzione f : I −→ R, con I ⊂ R 2 , il punto P 0 (x 0 , y 0 ), punto <strong>di</strong><br />
accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />
lim<br />
(x,y)→(x 0,y 0) f(x, y) = L 17
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
se:<br />
G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />
può essere data dal punto P 0 )<br />
G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />
se 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ allora |f(x, y) − L| < ɛ<br />
qualunque sia il punto P (x, y) ∈ I.<br />
Dalla definizione segue che, qualunque sia il valore <strong>di</strong> ɛ piccolo a piacere, è possibile<br />
trovare un intorno A δ (P 0 ) tale che per ogni punto in questo intorno <strong>di</strong>verso da P 0<br />
(0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ), vale la relazione |f(x, y) − L| < ɛ, cioè il valore f(x, y) si<br />
trova in un intorno <strong>di</strong> L <strong>di</strong> raggio ɛ.<br />
La definizione <strong>di</strong> limite per funzioni <strong>di</strong> due variabili si estende facilmente a funzioni <strong>di</strong> più<br />
variabili.<br />
Definizione 3.1.2 Siano dati una funzione f : I −→ R, con I ⊂ R n , il punto P 0 (x 1 , x 2 , . . . , x n ),<br />
punto <strong>di</strong> accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />
lim f(P ) = L<br />
P →P 0<br />
se:<br />
G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />
può essere data dal punto P 0 )<br />
G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />
se 0 < |P − P 0 | < δ allora |f(P ) − L| < ɛ<br />
qualunque sia il punto P ∈ I.<br />
Il limite <strong>di</strong> una funzione può valere anche ±∞ e si può anche parlare <strong>di</strong> limite per P che<br />
tende a infinito.<br />
Definizione 3.1.3 Data f : I −→ R, con I ⊂ R n e dato il punto P 0 <strong>di</strong> accumulazione per I si ha<br />
G lim P →P0 f(P ) = +∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />
se 0 < |P − P 0 | < δ allora f(P ) > M<br />
G lim P →P0 f(P ) = −∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />
se 0 < |P − P 0 | < δ allora f(P ) < −M<br />
G lim P →∞ f(P ) = L se per ogni valore ɛ > 0, esiste M > 0 tale che<br />
se |P | > M allora |f(P ) − L| < ɛ<br />
Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente<br />
ai limiti <strong>di</strong> funzioni <strong>di</strong> più variabili. Ad esempio, date due funzioni f e g, se lim P →P0 f(P ) = L<br />
e lim P →P0 g(P ) = M con L, M ∈ R, si ha<br />
G lim P →P0 f(P ) ± lim P →P0 g(P ) = L ± M<br />
G lim P →P0 f(P )g(P ) = LM<br />
f(P )<br />
G lim P →P0<br />
g(P ) = L (questo si ha se M ≠ 0).<br />
M<br />
Anche per funzioni <strong>di</strong> più variabili vale il teorema del confronto (noto anche come teorema<br />
dei carabinieri in italiano o squeeze theorem in inglese)<br />
18
3.1. Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />
Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x 0 , y 0 ).<br />
Teorema 3.1.1 Se f(x, y) ≤ g(x, y) ≤ h(x, y) per (x, y) in un intorno <strong>di</strong> (x 0 , y 0 ) e se vale<br />
lim f(x, y) = lim g(x, y) = L<br />
(x,y)→(x 0,y 0) (x,y)→(x 0,y 0)<br />
allora anche<br />
lim g(x, y) = L.<br />
(x,y)→(x 0,y 0)<br />
Osserviamo adesso alcuni punti importanti:<br />
G Se esiste il limite <strong>di</strong> una funzione per P che tende a un punto P 0 , questo limite è unico.<br />
G Per funzioni <strong>di</strong> una sola variabile f(x), l’esistenza del limite lim x→x0 f(x) implica che la<br />
funzione si avvicina allo stesso numero finito per x che si avvicina a x 0 sia da sinistra<br />
sia da destra.<br />
G Per funzioni <strong>di</strong> due variabili (e il <strong>di</strong>scorso vale in maniera del tutto analogo anche per<br />
funzioni <strong>di</strong> tre e più variabili), il limite lim (x,y)→(x0,y 0) f(x, y) = L esiste solo se f(x, y)<br />
tende allo stesso numero L qualunque sia il percorso che fa (x, y) per avvicinarsi a<br />
(x 0 , y 0 ) nel piano cartesiano. Ciò significa che (x, y) può avvicinarsi a (x 0 , y 0 ) lungo<br />
qualunque curva che possiamo in<strong>di</strong>viduare nel piano xy e il limite deve valere sempre<br />
L (si veda Figura 3.1).<br />
Abbiamo perciò la seguente proposizione<br />
Proposizione 3.1.1 Data f : I −→ R, I ⊂ R 2 , e dato P 0 punto <strong>di</strong> accumulazione per I, se<br />
esiste il limite lim (x,y)→(x0,y 0) f(x, y) e tale limite vale L numero reale, allora lo stesso limite si<br />
deve avere per P che tende a P 0 su qualunque sottoinsieme <strong>di</strong> I che ha P 0 come punto <strong>di</strong><br />
accumulazione.<br />
Al contrario, se esistono anche solo due sottoinsiemi <strong>di</strong> I in cui esiste il limite della f per P<br />
che tende a P 0 , ma il valore del limite nei due sottoinsiemi non è lo stesso, allora non può<br />
esistere il limite della funzione sull’insieme I <strong>di</strong> partenza (proprio in virtù della proposizione<br />
precedente).<br />
Ve<strong>di</strong>amo <strong>degli</strong> esempi <strong>di</strong> calcolo del limite <strong>di</strong> funzioni <strong>di</strong> due variabili.<br />
19
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Esempio<br />
Es. 3.1.1 Consideriamo i seguenti limiti:<br />
lim 3x −<br />
(x,y)→(2,2) y2 =<br />
lim<br />
(x,y)→(3,4) xy2 + x 2 y =<br />
In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto <strong>di</strong><br />
limite:<br />
lim 3x −<br />
(x,y)→(2,2) y2 = 6 − 4 = 2<br />
lim<br />
(x,y)→(3,4) xy2 + x 2 y = 48 + 36 = 84<br />
Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come<br />
somma <strong>di</strong> due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La<br />
seconda funzione è data dalla somma <strong>di</strong> due funzioni, ciascuna delle quali può essere<br />
vista come il prodotto <strong>di</strong> una funzione nella sola variabile x e <strong>di</strong> una funzione nella sola<br />
variabile y. Quin<strong>di</strong> calcoliamo il limite <strong>di</strong> queste funzioni, applichiamo la regola sul limite<br />
<strong>di</strong> prodotto <strong>di</strong> funzioni e otteniamo il risultato.<br />
Esempio<br />
3xy<br />
Es. 3.1.2 Consideriamo ora lim (x,y)→(0,0)<br />
x 2 + y 2 .<br />
Questo limite non esiste perchè si trovano facilmente due strade <strong>di</strong>verse per fare tendere<br />
il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori <strong>di</strong>versi del limite.<br />
Pren<strong>di</strong>amo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, <strong>di</strong>verso da<br />
zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite <strong>di</strong>venta<br />
lim<br />
(x,kx)→(0,0)<br />
3xkx<br />
x 2 + (kx) 2 =<br />
lim<br />
(x,kx)→(0,0)<br />
3kx 2<br />
x 2 + k 2 x 2 =<br />
2k<br />
1 + k 2<br />
Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta<br />
a funzione della sola variabile x, <strong>di</strong>pende da k, e quin<strong>di</strong> cambia al cambiare <strong>di</strong> k. Ciò<br />
significa che la funzione non può avere limite per (x, y) → 0.<br />
Osserviamo che la funzione data è un esempio <strong>di</strong> funzione che non è definita nel punto<br />
(0, 0) in quanto f(0, 0) = 0/0 è una forma indeterminata.<br />
Esempio<br />
Es. 3.1.3 Stu<strong>di</strong>amo ora lim (x,y)→(0,0)<br />
8xy 2<br />
x 2 + y 4 .<br />
Anche questa funzione è indeterminata in (0, 0).<br />
Proviamo a calcolare il limite sulle rette y = kx con k ∈ R, k ≠ 0. Otteniamo<br />
lim<br />
(x,kx)→(0,0)<br />
8k 2 x 3<br />
x 2 + k 4 x 4 = lim<br />
x→0<br />
8k 2 x<br />
1 + k 2 x 2 = 0<br />
Questo limite non <strong>di</strong>pende dunque dalla retta, in quanto non <strong>di</strong>pende da k.<br />
20
3.2. Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />
Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe<br />
corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto<br />
per avvicinarsi a (0, 0).<br />
Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo<br />
lim<br />
(ky 2 ,y)→(0,0)<br />
8ky 4<br />
k 2 y 4 + y 4 =<br />
8k<br />
k 2 + 1<br />
In questo caso, il limite <strong>di</strong>pende dalla curva x = ky 2 e il valore non è più 0 ma cambia<br />
al cambiare <strong>di</strong> k. Quin<strong>di</strong> il limite non esiste.<br />
Esempio<br />
Es. 3.1.4 Proviamo invece che<br />
lim<br />
(x,y)→(0,0)<br />
4x 2 y<br />
x 2 + y 2 = 0<br />
In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè<br />
dovremmo <strong>di</strong>mostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è<br />
sempre quello e, quin<strong>di</strong>, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo<br />
applicare la definizione <strong>di</strong> limite.<br />
Ora, poichè x 2 ≤ x 2 +y 2 x 2<br />
si ha<br />
x 2 + y 2 ≤ 1, mentre da y2 ≤ x 2 +y 2 , ricaviamo |y| ≤ √ x 2 + y 2 .<br />
Possiamo dunque <strong>di</strong>re che<br />
4x 2 y<br />
|<br />
x 2 + y 2 − 0| = | 4x 2 y<br />
x 2 + y 2 | ≤ |4y| ≤ 4√ x 2 + y 2<br />
Dalla definizione <strong>di</strong> limite, preso ɛ > 0, dobbiamo provare che esiste δ > 0 tale che per<br />
0 < √ x 2 + y 2 4x 2 y<br />
< δ, risulta |<br />
x 2 − 0| < ɛ.<br />
+ y2 Se scegliamo δ = ɛ/4, abbiamo:<br />
4x 2 y<br />
|<br />
x 2 + y 2 − 0| ≤ 4√ x 2 + y 2 < 4 ɛ 4 = ɛ<br />
4x 2 y<br />
Quin<strong>di</strong> abbiamo provato che |<br />
x 2 − 0| < ɛ, cioè il limite della nostra funzione per<br />
+ y2 (x, y) → (0, 0) vale esattamente 0.<br />
3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />
Definizione 3.2.1 Una funzione f : I −→ R, con I ⊂ R n è continua in P 0 (P 0 ∈ I e punto <strong>di</strong><br />
accumulazione per I), se<br />
lim f(P ) = f(P 0 )<br />
P →P 0<br />
Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, si ha:<br />
Definizione 3.2.2 Una funzione f : I −→ R, con I ⊂ R 2 è continua in P 0 (x 0 , y 0 ) (P 0 ∈ I e punto<br />
<strong>di</strong> accumulazione per I), se<br />
lim f(x, y) = f(x 0, y 0 )<br />
(x,y)→(x 0,y 0)<br />
21
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Definizione 3.2.3 Una funzione si <strong>di</strong>ce continua se è continua in ogni punto del suo insieme<br />
<strong>di</strong> definizione.<br />
Proposizione 3.2.1 Date due funzioni f e g continue in I ⊂ R 2 , allora<br />
f + g è continua;<br />
G fg è continua;<br />
G f è continua in tutti quei punti in g non si annulla;<br />
g<br />
G f ◦ g è continua (f ◦ g(x, y) = f(g(x, y)) funzione composta)<br />
Esempio<br />
Es. 3.2.1 lim (x,y)→(x0,y 0) x sin (xy) = x 0 sin (x 0 y 0 )<br />
La funzione f(x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il<br />
prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la ve<strong>di</strong>amo come la<br />
funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè<br />
x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione<br />
composta <strong>di</strong> funzioni continue è continua (quin<strong>di</strong> sin (xy) è continua) e il prodotto <strong>di</strong> x per<br />
sin (xy) dà ancora una funzione continua.<br />
Osserviamo che il concetto <strong>di</strong> continuità non è ovvio! Ci sono funzioni che ammettono<br />
limite per (x, y) che tende a (x 0 , y 0 ) ma il valore del limite non necessariamente è uguale al<br />
valore della funzione in (x 0 , y 0 ).<br />
Esempio<br />
Es. 3.2.2 La funzione definita come<br />
{<br />
0 se (x, y) ≠ (0, 0)<br />
f(x, y) =<br />
1 se (x, y) = (0, 0)<br />
ammette limite per (x, y) → (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa<br />
funzione non è continua in (0, 0). Difatti lim (x,y)→(0,0) f(x, y) = 0 ≠ f(0, 0) dal momento che<br />
la funzione è <strong>di</strong> costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa<br />
funzione è <strong>di</strong>scontinua in (0, 0).<br />
3.3 Derivate parziali<br />
Esten<strong>di</strong>amo ora il concetto <strong>di</strong> derivata che abbiamo visto per funzioni <strong>di</strong> una sola<br />
variabile, introducendo le derivate parziali.<br />
Data una funzione <strong>di</strong> una sola variabile, f(x), la derivata prima f ′ (x) rappresenta la<br />
velocità <strong>di</strong> variazione della funzione al variare <strong>di</strong> x.<br />
Con le funzioni <strong>di</strong> più variabili, ci sono due casi da considerare: cosa fare se varia solo<br />
una variabile mentre le altre non variano cosa fare se varia più <strong>di</strong> una variabile<br />
Concentriamo ora la nostra attenzione facendo cambiare una variabile alla volta e<br />
lasciando le altre fisse.<br />
Partiamo con un esempio, lavorando con una funzione <strong>di</strong> due variabili.<br />
Esempio<br />
Es. 3.3.1 Sia data f(x, y) = 4x 3 y 5 . Determiniamo la velocità con cui la funzione cambia<br />
in un punto fissato (x 0 , y 0 ), se non facciamo variare la y mentre facciamo variare la x,<br />
e viceversa, determiniamo la velocità con cui cambia la funzione in (x 0 , y 0 ) fissando x e<br />
variando y.<br />
22
3.3. Derivate parziali<br />
Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo interessati<br />
alla velocità della funzione nel punto (x 0 , y 0 ), per y fissato, vuol <strong>di</strong>re che dobbiamo<br />
considerare la funzione per y = y 0 . Consideriamo quin<strong>di</strong> f(x, y 0 ) = 4x 3 (y 0 ) 5 . Adesso<br />
abbiamo una funzione <strong>di</strong> una sola variabile, la x. Possiamo quin<strong>di</strong> considerare la funzione<br />
g(x) = f(x, y 0 ) = 4x 3 (y 0 ) 5 . Di questa funzione in una sola variabile, sappiamo<br />
cosa dobbiamo fare se vogliamo determinare la velocità <strong>di</strong> cambiamento della funzione<br />
per x = x 0 : dobbiamo calcolare la derivata prima g ′ (x 0 ). Nell’esempio, abbiamo<br />
g ′ (x 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />
Quello che abbiamo ottenuto prende il nome <strong>di</strong> derivata parziale <strong>di</strong> f(x, y) rispetto a x,<br />
nel punto (x 0 , y 0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli:<br />
f x (x 0 , y 0 )<br />
∂f<br />
∂x (x 0, y 0 ) D x f(x 0 , y 0 )<br />
Al posto <strong>di</strong> (x 0 , y 0 ) si può scrivere anche P 0 intendendo per P 0 il punto <strong>di</strong> coor<strong>di</strong>nate<br />
(x 0 , y 0 ).<br />
Quin<strong>di</strong>, nel nostro esempio, f x (x 0 , y 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />
Ve<strong>di</strong>amo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso,<br />
dobbiamo considerare la funzione h(y) = f(x 0 , y) = 4(x 0 ) 3 y 5 e calcolare la derivata prima<br />
<strong>di</strong> questa funzione che <strong>di</strong>pende dalla sola variabile y nel punto y 0 . Abbiamo h ′ (y 0 ) =<br />
20(x 0 ) 3 (y 0 ) 4 .<br />
Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel<br />
punto (x 0 , y 0 ). In<strong>di</strong>chiamo questa derivata parziale con uno dei seguenti simboli:<br />
f y (x 0 , y 0 )<br />
∂f<br />
∂y (x 0, y 0 ) D y f(x 0 , y 0 )<br />
Quin<strong>di</strong>, per l’esempio considerato, f y (x 0 , y 0 ) = 20(x 0 ) 3 (y 0 ) 4 .<br />
Passiamo dunque alla definizione generale delle derivate parziali prime <strong>di</strong> una funzione<br />
<strong>di</strong> due variabili (considerando le derivate non più in (x 0 , y 0 ) ma nel generico punto (x, y)).<br />
Definizione 3.3.1 Data una funzione f(x, y), le derivate parziali prime rispetto alle variabili x<br />
e y sono date da:<br />
f(x + h, y) − f(x, y)<br />
(x, y) = lim<br />
h→0 h<br />
∂f<br />
∂x<br />
∂f<br />
(x, y) = lim<br />
∂y h→0<br />
f(x, y + h) − f(x, y)<br />
h<br />
Derivate per funzioni scalari e derivate per funzioni <strong>di</strong> due variabili<br />
f(x) =⇒ f ′ (x) = df<br />
dx<br />
f(x, y) =⇒ f x (x, y) = ∂f<br />
∂x<br />
&<br />
f y (x, y) = ∂f<br />
∂y<br />
Per calcolare le derivate parziali prime <strong>di</strong> una funzione bisogna fare questo ragionamento:<br />
se dobbiamo calcolare f x (x, y) dobbiamo trattare la variabile y come una costante e trattare la<br />
funzione come se <strong>di</strong>pendesse dalla sola x; se dobbiamo calcolare f y (x, y), dobbiamo trattare<br />
x come una costante e calcolare la derivata rispetto a y come se la funzione fosse <strong>di</strong>pendente<br />
dalla sola variabile y.<br />
23
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Esempio<br />
Es. 3.3.2 Calcolare le derivate parziali prime della funzione f(x, y) = 3x 5 + 2 √ y − 10xy.<br />
Per calcolare la derivata f x (x, y) trattiamo la y come una costante, da cui f x (x, y) = 15x 4 −<br />
10y. Notiamo che la derivata rispetto a x <strong>di</strong> 2 √ y vale zero perchè la y è una costante.<br />
Al contrario, per calcolare f y (x, y) dobbiamo ora trattare x come una costante, da cui<br />
f y (x, y) = 1 √ y<br />
− 10x.<br />
3.4 Interpretazione delle derivate parziali<br />
Sono possibili due interpretazioni sul significato delle derivate parziali prime.<br />
G Se consideriamo la derivata parziale come la velocità <strong>di</strong> cambiamento della funzione<br />
allora f x (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al variare <strong>di</strong> x<br />
per y fissato, mentre f y (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al<br />
variare <strong>di</strong> y per x fissato. Quin<strong>di</strong> se f x (x 0 , y 0 ) > 0 vuol <strong>di</strong>re che la funzione è crescente<br />
in quel punto al variare <strong>di</strong> x, per y 0 fissato, mentre se f x (x 0 , y 0 ) < 0 vuol <strong>di</strong>re che la<br />
funzione è decrescente in quel punto al variare <strong>di</strong> x, per y 0 fissato. Stesso <strong>di</strong>scorso vale<br />
su f y (x 0 , y 0 ): se f y (x 0 , y 0 ) > 0 allora la funzione è crescente in quel punto al variare <strong>di</strong> y,<br />
per x 0 fissato, mentre se f y (x 0 , y 0 ) < 0 la funzione è decrescente in quel punto al variare<br />
<strong>di</strong> y, per x 0 fissato. È possibile che una funzione sia crescente fissato y e decrescente<br />
fissato x o viceversa.<br />
G L’altra interpretazione, geometrica, estende il concetto <strong>di</strong> pendenza della retta tangente<br />
che abbiamo per funzioni <strong>di</strong> una sola variabile, per cui f ′ (x 0 ) rappresenta la pendenza<br />
della retta tangente alla funzione f(x) nel punto x 0 . Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili,<br />
f x (x 0 , y 0 ) rappresenta la pendenza della traccia della funzione f(x, y) nel piano y = y 0 nel<br />
punto (x 0 , y 0 ) (in altre parole è la pendenza della retta tangente alla curva che si ottiene<br />
intersecando la superficie che rappresenta la funzione f(x, y), cioè il grafico della f, con<br />
il piano verticale y = y 0 ), mentre f y (x 0 , y 0 ) rappresenta la pendenza della traccia della<br />
funzione f(x, y) con il piano x = x 0 nel punto (x 0 , y 0 ).<br />
3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato<br />
Così come per le funzioni <strong>di</strong> una sola variabile è possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne<br />
più elevato (derivata seconda, terza, quarta, n-sima), anche per le funzioni <strong>di</strong> più variabili è<br />
possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne più elevato. Ci soffermiamo al caso <strong>di</strong> funzioni <strong>di</strong> due<br />
variabili.<br />
Data una funzione f(x, y), dal momento che abbiamo due derivate parziali prime f x e<br />
f y , su ciascuna <strong>di</strong> queste funzioni possiamo pensare <strong>di</strong> applicare ancora la definizione<br />
<strong>di</strong> derivata parziale rispetto a x e rispetto a y, ottenendo, in tal modo, quattro possibili<br />
combinazioni.<br />
Abbiamo le seguenti scritture:<br />
(f x ) x = f xx = ∂ ( ) ∂f<br />
∂x ∂x<br />
(f x ) y = f xy = ∂ ( ) ∂f<br />
∂y ∂x<br />
= ∂2 f<br />
∂x 2<br />
= ∂2 f<br />
∂y∂x<br />
24
3.6. Differenziabilità <strong>di</strong> una funzione<br />
(f y ) x = f yx = ∂ ( ) ∂f<br />
∂x ∂y<br />
(f y ) y = f yy = ∂ ( ) ∂f<br />
∂y ∂y<br />
= ∂2 f<br />
∂x∂y<br />
= ∂2 f<br />
∂y 2<br />
Le derivate f xy e f yx sono dette anche derivate parziali miste perchè le derivate sono fatte<br />
rispetto a più <strong>di</strong> una variabile.<br />
Osserviamo che, dal punto <strong>di</strong> vista della notazione usata, quando l’in<strong>di</strong>ce della derivata<br />
parziale è posta in basso della funzione, per esempio f xy , dobbiamo derivare da sinistra verso<br />
destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando<br />
invece usiamo la notazione frazionale ( ∂2 f<br />
) la notazione è opposta: si va da destra verso<br />
∂y∂x<br />
sinistra. Nell’esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y.<br />
Esempio<br />
Es. 3.5.1 Calcolare le derivate seconde <strong>di</strong> f(x, y) = sin (xy) − x 3 e 4y + 4y 2 .<br />
Prima <strong>di</strong> tutto calcoliamo le derivate parziali prime:<br />
f x (x, y) = y cos (xy) − 3x 2 e 4y<br />
f y (x, y) = x cos (xy) − 4x 3 e 4y + 8y<br />
Passiamo ora alle derivate seconde:<br />
f xx (x, y) = −y 2 sin (xy) − 6xe 4y<br />
f xy (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />
f yx (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />
f yy (x, y) = −x 2 sin (xy) − 16x 3 e 4y + 8<br />
Nell’esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta <strong>di</strong> una<br />
“coincidenza” o no In realtà la funzione data gode <strong>di</strong> una proprietà importante che ci<br />
permette <strong>di</strong> avere questo risultato.<br />
Teorema 3.5.1 (<strong>di</strong> Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che<br />
contiene il punto (x 0 , y 0 ), se le funzioni f xy e f yx sono continue in A, allora<br />
f xy (x 0 , y 0 ) = f yx (x 0 , y 0 ).<br />
3.6 Differenziabilità <strong>di</strong> una funzione<br />
Prima <strong>di</strong> entrare a parlare <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong> una funzione,<br />
introduciamo una<br />
notazione per <strong>degli</strong> spazi <strong>di</strong> funzioni definite in un insieme aperto I ⊂ R 2 .<br />
G Si in<strong>di</strong>ca con C 0 (I) l’insieme delle funzioni continue in I (si <strong>di</strong>ce anche che la funzione<br />
è <strong>di</strong> classe C 0 ).<br />
G Si in<strong>di</strong>ca con C 1 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime<br />
sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 1 ).<br />
G Si in<strong>di</strong>ca con C 2 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime e<br />
seconde sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 2 ).<br />
25
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Definizione 3.6.1 Sia data una funzione f : A −→ R con A ⊂ R 2 , A aperto, e un punto<br />
P 0 (x 0 , y 0 ) ∈ A. Diremo che f è <strong>di</strong>fferenziabile in P 0 se esistono due numeri reali λ e µ tali che<br />
f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />
lim<br />
√ = 0<br />
(x,y)→(x 0,y 0)<br />
(x − x0 ) 2 + (y − y 0 ) 2<br />
In maniera del tutto equivalente si può <strong>di</strong>re che f è <strong>di</strong>fferenziabile se<br />
f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />
è infinitesima <strong>di</strong> or<strong>di</strong>ne superiore rispetto all’infinitesimo √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />
Applicando la definizione <strong>di</strong> limite, <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 , vuol <strong>di</strong>re che, qualunque<br />
sia ɛ > 0 esiste δ > 0 tale che per ogni (x, y) ∈ A, con 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ<br />
risulta<br />
|f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )] | < ɛ √ (x − x 0 ) 2 + (y − y 0 ) 2<br />
In modo equivalente, possiamo anche <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 se esistono due<br />
numeri λ e µ e una funzione σ(x, y) definita in un intorno T <strong>di</strong> P 0 e infinitesima per (x, y) →<br />
(x 0 , y 0 ) tale che, per ogni (x, y) ∈ T , vale:<br />
f(x, y) − f(x 0 , y 0 ) = λ(x − x 0 ) + µ(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />
Vale la seguente proposizione.<br />
Proposizione 3.6.1 Se f : A −→ R, con A ⊂ R 2 , A aperto, è <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />
esistono le derivate parziali prime <strong>di</strong> f in P 0 e vale: f x (P 0 ) = λ e f y (P 0 ) = µ.<br />
Dimostrazione. Sappiamo che la f è <strong>di</strong>fferenziabile, dobbiamo provare che f x (P 0 ) = λ e<br />
f y (P 0 ) = µ.<br />
Fissiamo la variabile y, prendendo y = y 0 . Dalla definizione <strong>di</strong> <strong>di</strong>fferenziabilità si ha:<br />
f(x, y 0 ) − f(x 0 , y 0 ) = λ(x − x 0 ) + |x − x 0 |σ(x, y 0 )<br />
con σ la funzione infinitesima definita prima. Il termine che moltiplica µ si annulla (abbiamo<br />
y 0 − y 0 ) come pure √ (x − x 0 ) 2 + (y − y 0 ) 2 si riduce a |x − x 0 | per y = y 0 .<br />
Divi<strong>di</strong>amo la relazione trovata per x − x 0 , ricavando<br />
f(x, y 0 ) − f(x 0 , y 0 )<br />
x − x 0<br />
= λ + |x − x 0|<br />
x − x 0<br />
σ(x, y 0 )<br />
Passando al limite per x → x 0 , poichè σ(x, y 0 ) è infinitesima e |x − x 0|<br />
x − x 0<br />
funzione |x − x 0|<br />
σ(x, y 0 ) è ancora infinitesima. Quin<strong>di</strong> si ha<br />
x − x 0<br />
f(x, y 0 ) − f(x 0 , y 0 )<br />
lim<br />
= λ<br />
x→x 0 x − x 0<br />
è limitata (vale ±1), la<br />
Il limite che abbiamo calcolato rappresenta la derivata prima della funzione f(x, y 0 ) che<br />
<strong>di</strong>pende dalla sola variabile x, nel punto x 0 : essa è, quin<strong>di</strong>, la derivata parziale prima della f<br />
rispetto a x. Abbiamo ottenuto che f x (x 0 , y 0 ) = λ.<br />
Con lo stesso ragionamento, si prova che f y (x 0 , y 0 ) = µ. Si deve far variare il punto (x, y)<br />
su una retta parallela all’asse y, per x = x 0 . In tal caso, la definizione <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong><br />
dà:<br />
26<br />
f(x 0 , y) − f(x 0 , y 0 ) = µ(y − y 0 ) + |y − y 0 |σ(x 0 , y)
3.7. Differenziale<br />
Dividendo per y − y 0 si ha<br />
f(x 0 , y) − f(x 0 , y 0 )<br />
y − y 0<br />
= µ + |y − y 0|<br />
y − y 0<br />
σ(x 0 , y)<br />
Passando al limite per y → y 0 si ha che |y − y 0|<br />
y − y 0<br />
σ(x 0 , y) → 0 e quin<strong>di</strong><br />
f(x 0 , y) − f(x 0 , y 0 )<br />
lim<br />
= µ<br />
y→y 0 y − y 0<br />
vale a <strong>di</strong>re f y (x 0 , y 0 ) = µ.<br />
Quin<strong>di</strong> se f è <strong>di</strong>fferenziabile in P 0 , la f ammette le derivate parziali prime in P 0 e vale<br />
f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />
✔<br />
Come conseguenza, una funzione <strong>di</strong>fferenziabile in P 0 è continua in P 0 .<br />
Proposizione 3.6.2 Sia f : A −→ R, con A aperto <strong>di</strong> R 2 . Sia f <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />
f è continua in P 0 .<br />
Dimostrazione. Poichè f è <strong>di</strong>fferenziabile in P 0 , esiste una funzione infinitesima per<br />
(x, y) → (x 0 , y 0 ) , σ(x, y) , tale che<br />
cioè<br />
f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />
Per (x, y) → (x 0 , y 0 ) il secondo membro della relazione appena scritta tende a zero, quin<strong>di</strong><br />
lim f(x, y) − f(x 0, y 0 ) = 0<br />
(x,y)→(x 0,y 0)<br />
lim f(x, y) = f(x 0, y 0 )<br />
(x,y)→(x 0,y 0)<br />
La f è continua in P 0 . ✔<br />
Teorema 3.6.1 Se f ∈ C 1 (A), con A aperto <strong>di</strong> R 2 , allora f è <strong>di</strong>fferenziabile in A.<br />
3.7 Differenziale<br />
Ricor<strong>di</strong>amo ora il concetto <strong>di</strong> <strong>di</strong>fferenziale <strong>di</strong> una funzione <strong>di</strong> una sola variabile.<br />
Definizione 3.7.1 Data una funzione f(x) e assumendo che la derivata f ′ (x) = df<br />
dx<br />
un punto x, il <strong>di</strong>fferenziale totale df della funzione è dato da<br />
( ) df<br />
df = dx = f ′ (x)dx.<br />
dx<br />
esiste in<br />
La quantità df può essere interpretata come il cambiamento infinitesimale del valore della<br />
funzione f(x) quando x cambia <strong>di</strong> una quantità infinitesima dx. Per esprimere questo da un<br />
punto <strong>di</strong> vista formale, consideriamo l’incremento ∆f = f(x + ∆x) − f(x) che rappresenta<br />
l’incremento sulla f quando x è incrementato <strong>di</strong> una quantità finita ∆x.<br />
27
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Applicando il teorema del valor me<strong>di</strong>o, possiamo riscrivere<br />
∆f = f ′ (x + θ∆x)∆x, dove θ ∈ (0, 1).<br />
Ora passando al limite per ∆x → dx, ∆f → df, essendo df un incremento infinitesimale.<br />
Dal momento che dx è molto piccolo, possiamo <strong>di</strong>re che dx ≪ x e quin<strong>di</strong> x + θdx ≈ x da cui<br />
df = f ′ (x)dx.<br />
Ritroviamo la formula data per il <strong>di</strong>fferenziale df.<br />
Qualcosa <strong>di</strong> simile si ritrova nelle funzioni <strong>di</strong> due variabili.<br />
Definizione 3.7.2 Data f(x, y) funzione <strong>di</strong> due variabili, con derivate parziali prime continue,<br />
si definisce <strong>di</strong>fferenziale totale della f<br />
( ) ( )<br />
∂f ∂f<br />
df = dx + dy = f x dx + f y dy.<br />
∂x ∂y<br />
Il <strong>di</strong>fferenziale df rappresenta la variazione della f quando le variabili x e y cambiano <strong>di</strong> una<br />
quantità infinitesima dx e dy.<br />
Per arrivare a questa formula, definiamo ∆f la variazione che si ha variando x e y <strong>di</strong> una<br />
quantità ∆x e ∆y rispettivamente.<br />
∆f = f(x + ∆x, y + ∆y) − f(x, y)<br />
aggiungiamo e sottraiamo f(x, y + ∆y)<br />
f(x + ∆x, y + ∆y) − f(x, y + ∆y) + f(x, y + ∆y) − f(x, y)<br />
} {{ } } {{ }<br />
incremento con y+∆y fissato incremento con x fissato<br />
Abbiamo sud<strong>di</strong>viso ∆f in due pezzi, il primo contenente una variazione solo in x e l’altro<br />
contenente una variazione solo in y. Applicando il teorema del valor me<strong>di</strong>o come prima,<br />
otteniamo<br />
∆f = f x (x + θ 1 ∆x, y + ∆y)∆x + f y (x, y + θ 2 ∆y)∆y con θ 1 , θ 2 ∈ (0, 1).<br />
Per ∆x → dx e per ∆y → dy, con dx e dy incrementi infinitesimali (da cui dx ≪ x e dy ≪ y),<br />
risulta che ∆f → f, ricavando l’espressione df = f x dx + f y dy.<br />
3.8 Derivata <strong>di</strong>rezionale<br />
La derivata <strong>di</strong>rezionale <strong>di</strong> una funzione permette <strong>di</strong> calcolare la velocità <strong>di</strong> variazione<br />
della funzione in una assegnata <strong>di</strong>rezione. Le derivate parziali rispetto a x e rispetto a y<br />
rappresentano la velocità <strong>di</strong> variazione lungo le <strong>di</strong>rezioni x e y rispettivamente. Supponiamo<br />
ora <strong>di</strong> voler calcolare come cambia una funzione f(x, y) nel punto (x 0 , y 0 ), lungo la <strong>di</strong>rezione<br />
<strong>di</strong> un arbitrario vettore unitario ⃗v <strong>di</strong> componenti α 1 e α 2 . Dire che ⃗v è unitario, significa che<br />
la norma euclidea del vettore vale uno, cioè (α 1 ) 2 + (α 2 ) 2 = 1.<br />
Geometricamente, se consideriamo la superficie <strong>di</strong> equazione z = f(x, y) (il grafico della<br />
f), il piano verticale che passa attraverso il punto (x 0 , y 0 , f(x 0 , y 0 )), nella <strong>di</strong>rezione data da<br />
⃗v, interseca la superficie in una curva. La pendenza della tangente alla curva nel punto<br />
(x 0 , y 0 , f(x 0 , y 0 )) rappresenta la velocità <strong>di</strong> variazione della f nella <strong>di</strong>rezione ⃗v, cioè la derivata<br />
<strong>di</strong>rezionale della f lungo ⃗v.<br />
Al fine <strong>di</strong> calcolare questa derivata <strong>di</strong>rezionale, consideriamo un punto P (x, y) che si trova<br />
sul piano xy lungo la retta passante per P 0 (x 0 , y 0 ) e avente <strong>di</strong>rezione data da ⃗v. La retta si<br />
28
3.8. Derivata <strong>di</strong>rezionale<br />
può scrivere come P = P 0 + h⃗v con h scalare. Ciò significa che le coor<strong>di</strong>nate del punto P si<br />
possono scrivere come<br />
x = x 0 + hα 1 y = y 0 + hα 2<br />
La variazione della f tra il punto P e il punto P 0 è data da f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 ).<br />
Definizione 3.8.1 Definiamo derivata <strong>di</strong>rezionale della f lungo la <strong>di</strong>rezione ⃗v il limite, se<br />
esiste ed è finito,<br />
f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />
lim<br />
h→0<br />
h<br />
Questo limite si in<strong>di</strong>ca in modo equivalente tramite la scrittura ∂f<br />
∂⃗v (x 0, y 0 ) o D ⃗v f(P 0 ).<br />
Dalla definizione data, risulta evidente che se ⃗v = ⃗i in<strong>di</strong>cando con ⃗i il versore unitario<br />
dell’asse x, <strong>di</strong> componenti (1, 0), allora D ⃗v f(P 0 ) = f x (P 0 ), mentre se ⃗v = ⃗j il versore unitario<br />
dell’asse y, <strong>di</strong> componenti (0, 1), allora D ⃗v f(P 0 ) = f y (P 0 ). Quin<strong>di</strong> le derivate parziali rispetto<br />
a x e rispetto a y sono un caso particolare <strong>di</strong> derivate <strong>di</strong>rezionali.<br />
Vale il seguente teorema, detto formula del gra<strong>di</strong>ente perchè la derivata <strong>di</strong>rezionale, sotto<br />
determinate con<strong>di</strong>zioni, è legata al gra<strong>di</strong>ente della funzione assegnata.<br />
Definizione 3.8.2 Data una funzione f che ammette derivate parziali in P 0 , il vettore in<strong>di</strong>cato<br />
con il simbolo ⃗ ∇f(P 0 ) o grad f(P 0 ) prende il nome <strong>di</strong> gra<strong>di</strong>ente della funzione in P 0 e ha come<br />
componenti le derivate parziali prime della f in P 0 :<br />
⃗∇f(P 0 ) = (f x (P 0 ), f y (P 0 )).<br />
Teorema 3.8.1 (Formula del gra<strong>di</strong>ente) Data f : A −→ R con A ⊂ R 2 , se f è <strong>di</strong>fferenziabile<br />
in P 0 (x 0 , y 0 ) allora f ammette derivata <strong>di</strong>rezionale lungo una qualsiasi <strong>di</strong>rezione unitaria<br />
⃗v(α 1 , α 2 ) e risulta<br />
∂f<br />
∂⃗v (P 0) = f x (P 0 )α 1 + f y (P 0 )α 2<br />
Quin<strong>di</strong> la derivata <strong>di</strong>rezionale si può vedere come il prodotto scalare tra il gra<strong>di</strong>ente della<br />
funzione in P 0 e il vettore ⃗v.<br />
∂f<br />
∂⃗v (P 0) = ⃗ ∇f(P 0 ) · ⃗v<br />
Dimostrazione.<br />
Poichè f è <strong>di</strong>fferenziabile, vale<br />
f(x, y) − f(x 0 , y 0 ) = f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2<br />
dove σ è una funzione infinitesima per (x, y) → (x 0 , y 0 ).<br />
Poichè devo calcolare la derivata <strong>di</strong>rezionale, considero come punto (x, y) il punto che si<br />
trova sulla retta passante per (x 0 , y 0 ) e avente <strong>di</strong>rezione data dal vettore ⃗v. Quin<strong>di</strong>, come<br />
prima, x = x 0 + hα 1 e y = y 0 + hα 2 .<br />
Sostituendo nella formula della <strong>di</strong>fferenziabilità si ricava:<br />
f(x 0 +hα 1 , y 0 +hα 2 )−f(x 0 , y 0 ) = f x (P 0 )(hα 1 )+f y (P 0 )(hα 2 )+σ(x 0 +hα 1 , y 0 +hα 2 ) √ h 2 (α 1 ) 2 + h 2 (α 2 ) 2<br />
Divi<strong>di</strong>amo ambo i membri per h, ricordando anche che, poichè il vettore è unitario, si ha<br />
√<br />
h2 (α 1 ) 2 + h 2 (α 2 ) 2 = |h| √ (α 1 ) 2 + (α 2 ) 2 = |h|. Quin<strong>di</strong> si ottiene:<br />
f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />
h<br />
= f x (P 0 )α 1 + f y (P 0 )α 2 + |h|<br />
h σ(x 0 + hα 1 , y 0 + hα 2 )<br />
29
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
Passando al limite per h → 0, a primo membro si ha proprio il limite della definizione <strong>di</strong><br />
derivata <strong>di</strong>rezionale lungo ⃗v, mentre a secondo membro si ottiene f x (P 0 )α 1 + f y (P 0 )α 2 in<br />
quanto la quantità |h|<br />
h σ(x 0 + hα 1 , y 0 + hα 2 ) tende a 0 poichè è prodotto <strong>di</strong> un infinitesimo (la<br />
funzione σ) per la costante |h|<br />
h = ±1).<br />
Si ricava quin<strong>di</strong> l’asserto. ✔<br />
3.9 Derivazione nelle funzioni composte<br />
Per funzioni scalari, è frequente avere a che fare con funzioni del tipo y = f(x) dove però<br />
x è a sua volta funzione <strong>di</strong> un’altra variabile t, x = g(t).<br />
Se scriviamo F (t) = f(g(t)), sappiamo che F ′ (t) = f ′ (g(t))g ′ (t): applichiamo la regola <strong>di</strong><br />
derivazione sulle funzioni composte.<br />
C’è una notazione alternativa a questa: da y = f(x) con x = g(t), abbiamo<br />
dy<br />
dt = dy dx<br />
dx dt .<br />
Per funzioni <strong>di</strong> più variabili, abbiamo <strong>di</strong>versi casi da considerare. Ne consideriamo i<br />
principali.<br />
G Primo caso: Sia z = f(x, y) con x = g(t) e y = h(t). Supponiamo che la f sia una<br />
funzione <strong>di</strong>fferenziabile <strong>di</strong> (x, y) e che g e h siano funzioni <strong>di</strong>fferenziabili <strong>di</strong> t. Allora z è<br />
una funzione <strong>di</strong>fferenziabile <strong>di</strong> t e si ha<br />
30<br />
dz<br />
dt = ∂f dx<br />
∂x dt + ∂f dy<br />
∂y dt<br />
Osserviamo che la derivata <strong>di</strong> z rispetto a t è una derivata totale.<br />
Esempio<br />
Es. 3.9.1 Sia z = f(x, y) = x 3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo dz<br />
dt<br />
applicando la formula. Poichè ∂f<br />
∂x = 3x2 y + 3y 2 , ∂f<br />
∂y = x3 + 6xy, dx = 2 cos (2t) e<br />
dt<br />
dy<br />
= − sin (t), ricaviamo:<br />
dt<br />
dz<br />
dt = (3x2 y + 3y 2 )2 cos (2t) + (x 3 + 6xy)(− sin (t))<br />
A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x<br />
e y in funzione <strong>di</strong> t:<br />
dz<br />
dt = (3 sin2 (2t) cos (t) + 3 cos 2 (t))2 cos (2t) + (sin 3 (2t) + 6 sin (2t) cos (t)(− sin (t))<br />
e sistemando meglio i termini a destra ricaviamo<br />
dz<br />
dt = 6(sin2 (2t) cos (2t) cos (t)+cos 2 (t) cos (2t))−(sin 2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)).<br />
G Secondo caso: : z = f(x, y) con x = g(s, t) e y = h(s, t). Le funzioni f, g e h siano<br />
<strong>di</strong>fferenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s<br />
e t. Otteniamo<br />
∂z<br />
∂s = ∂f ∂x<br />
∂x ∂s + ∂f ∂y<br />
∂y ∂s<br />
∂z<br />
∂t = ∂f ∂x<br />
∂x ∂t + ∂f ∂y<br />
∂y ∂t
3.10. Piano tangente ad una superficie<br />
Esempio<br />
Es. 3.9.2 Sia z = f(x, y) = e 2x sin (y) con x = st e y = s 2 t.<br />
In tal caso, applicando la formula abbiamo:<br />
∂z<br />
∂s = 2e2x sin (y)t + e 2x cos (y)(2s) = 2e 2st (t sin (s 2 t) + s cos (s 2 t))<br />
∂z<br />
∂t = 2e2x sin (y)s + e 2x cos (y)s 2 = se 2st (2 sin (s 2 t) + s cos (s 2 t))<br />
3.10 Piano tangente ad una superficie<br />
Per funzioni <strong>di</strong> una variabile, se facciamo uno zoom intorno ad un punto del grafico <strong>di</strong><br />
una funzione <strong>di</strong>fferenziabile, il grafico si <strong>di</strong>scosta <strong>di</strong> poco dalla sua retta tangente in quel<br />
punto e possiamo approssimare la funzione, in un intorno del punto, tramite l’equazione <strong>di</strong><br />
una retta.<br />
Un <strong>di</strong>scorso simile si può sviluppare per funzioni <strong>di</strong> due variabili. Qui lo zoom si deve<br />
fare intorno ad un punto della superficie che rappresenta il grafico <strong>di</strong> una funzione <strong>di</strong>fferenziabile.<br />
E il grafico si <strong>di</strong>scosterà poco da un piano (il suo piano tangente in quel punto),<br />
così che potremo approssimare la funzione, in un intorno del punto, tramite l’equazione del<br />
piano tangente.<br />
Sia S la superficie dell’equazione z = f(x, y), con f <strong>di</strong>fferenziabile e <strong>di</strong> classe C 1 . Sia<br />
P 0 (x 0 , y 0 , f(x 0 , y 0 ) un punto <strong>di</strong> S. Consideriamo le curve che intersecano i piani verticali<br />
y = y 0 e x = x 0 sulla superficie S. Il punto <strong>di</strong> intersezione della due curve è proprio il punto<br />
P 0 . Siano T 1 e T 2 le rette tangenti alle due curve nel punto P 0 (le pendenze <strong>di</strong> queste rette<br />
sono date dalle derivate parziali rispetto a x e y). Allora il piano tangente alla superficie<br />
S nel punto P 0 è definito come il piano che contiente entrambe le rette tangenti T 1 e T 2 .<br />
Possiamo pensare a questo piano tangente come il piano in cui ci sono tutte le possibili<br />
rette tangenti per P 0 alle curve che giacciono su S e passano attraverso P 0 (considerando le<br />
derivate <strong>di</strong>rezionali). Il piano tangente è quin<strong>di</strong> il piano che più approssima la superficie S<br />
intorno al punto P 0 .<br />
Un piano passante per il punto P 0 ha equazione nella forma<br />
a(x − x 0 ) + b(y − y 0 ) + c(z − f(x 0 , y 0 )) = 0<br />
Dividendo per c e ponendo A = −a/c e B = −b/c, possiamo scrivere<br />
z − f(x 0 , y 0 ) = A(x − x 0 ) + B(y − y 0 )<br />
Se questa equazione deve rappresentare l’equazione del piano tangente a P 0 sulla superficie,<br />
vuol <strong>di</strong>re che l’intersezione con il piano y = y 0 deve essere la retta tangente T 1 . Ponendo<br />
y = y 0 , l’equazione si riduce a<br />
z − f(x 0 , y 0 ) = A(x − x 0 ), y = y 0<br />
Ora questa è l’equazione <strong>di</strong> una retta che ha pendenza A. Ma la pendenza della tangente T 1<br />
è f x (x 0 , y 0 ). Perciò A = f x (x 0 , y 0 ).<br />
Allo stesso modo, considerando il piano x = x 0 , il piano tangente si riduce a<br />
z − f(x 0 , y 0 ) = B(y − y 0 ), x = x 0<br />
che rappresenta la retta tangente T 2 con pendenza B = f y (x 0 , y 0 ).<br />
Quin<strong>di</strong> l’equazione del piano tangente è data da<br />
z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ).<br />
31
3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />
3.11 Formula <strong>di</strong> Taylor<br />
Quando si considerano funzioni scalari <strong>di</strong>fferenziabili e continue, la formula <strong>di</strong> Taylor è<br />
utile per approssimare la funzione in un intorno <strong>di</strong> un punto. Data la funzione f(x) e x 0 un<br />
punto che appartiene all’insieme <strong>di</strong> definizione della f, possiamo scrivere:<br />
f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />
f ′′ (ξ x )<br />
2<br />
dove ξ x è un punto che si trova nell’insieme <strong>di</strong> definizione della f ed è compreso tra x e x 0 .<br />
La formula appena scritta prende il nome <strong>di</strong> formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 e permette <strong>di</strong><br />
approssimare la funzione f(x) in un intorno <strong>di</strong> x 0 utlizzando i valori della funzione in x 0 . Il<br />
polinomio T 1 (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) è il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado. In questo caso<br />
rappresenta la retta tangente alla funzione f nel punto x 0 . Se noi approssiamo f(x) me<strong>di</strong>ante<br />
il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado, commettiamo un errore dato da R 1 (x) = (x − x 0) 2<br />
f ′′ (ξ x ),<br />
2<br />
che possiamo maggiorare, in valore assoluto, considerando M = max |f ′′ (x)| per x che varia<br />
nell’insieme <strong>di</strong> definizione della f, ottenendo | (x − x 0) 2<br />
f ′′ (ξ x )| ≤ |M (x − x 0) 2<br />
|, un errore del<br />
2<br />
2<br />
secondo or<strong>di</strong>ne.<br />
In generale, il polinomio <strong>di</strong> Taylor <strong>di</strong> grado n è dato da<br />
T n (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />
2!<br />
(x − x 0 ) 2 + f (3) (x 0 )<br />
3!<br />
(x − x 0 ) 3 + . . . + f (n) (x 0 )<br />
(x − x 0 ) n<br />
n!<br />
Se approssimiamo f(x) con il polinomio <strong>di</strong> Taylor T n (x), l’errore che si commette è <strong>di</strong> or<strong>di</strong>ne<br />
n + 1, poichè vale R n (x) = f (n+1) (ξ x )<br />
(x − x 0 ) n+1 .<br />
(n + 1)!<br />
Nel caso <strong>di</strong> funzioni <strong>di</strong> più variabili, il polinomio <strong>di</strong> Taylor deve considerare le derivate<br />
parziali della funzioni.<br />
Teorema 3.11.1 Consideriamo una funzione f(x, y) <strong>di</strong> classe C 2 . Allora per ogni punto P 0<br />
nell’insieme <strong>di</strong> definizione della f, vale la formula <strong>di</strong> Taylor data da<br />
f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />
+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />
dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />
Se approssimiamo la funzione f(x, y) con il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado dato da<br />
T 1 (x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />
commettiamo un errore dato da<br />
R 1 (x) = 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />
che è un errore del secondo or<strong>di</strong>ne (abbiamo infatti le potenze (x − x 0 ) 2 , (x − x 0 )(y − y 0 ),<br />
(y − y 0 ) 2 ).<br />
Osserviamo che il polinomio <strong>di</strong> Taylor T 1 (x, y) altro non è che l’equazione del piano<br />
tangente alla superficie della funzione f(x, y) nel punto (x 0 , y 0 , f(x 0 , y 0 )).<br />
Se consideriamo il polinomio <strong>di</strong> Taylor <strong>di</strong> or<strong>di</strong>ne zero per approssimare la funzione f(x, y),<br />
abbiamo il cosidetto teorema <strong>di</strong> Lagrange.<br />
32
3.11. Formula <strong>di</strong> Taylor<br />
Teorema 3.11.2 (<strong>di</strong> Lagrange) Data f : A −→ R con A ⊂ R 2 , f <strong>di</strong> classe C 1 , e dato P 0 (x 0 , y 0 ) ∈<br />
A, si ha<br />
f(x, y) = f(x 0 , y 0 ) + f x (ξ x , η y )(x − x 0 ) + f y (ξ x , η y )(y − y 0 )<br />
dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />
33
CAPITOLO 4<br />
Massimi e minimi<br />
La maggior parte delle idee<br />
fondamentali della scienza<br />
sono essenzialmente semplici,<br />
e possono, come una regola,<br />
essere espresse in un<br />
linguaggio comprensibile a<br />
tutti.<br />
Albert Einstein (1879-1955)<br />
4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />
4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />
4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . . 47<br />
4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />
4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />
4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . . 52<br />
4.1 Forme quadratiche<br />
Prima <strong>di</strong> passare a definire i massimi e minimi <strong>di</strong> una funzione <strong>di</strong> più variabili, ci conviene<br />
introdurre il concetto <strong>di</strong> forma quadratica perchè ci servirà per poter calcolare i massimi e i<br />
minimi.<br />
Nello spazio R 2 , una forma quadratica è un polinomio omogeneo <strong>di</strong> secondo grado nelle<br />
variabili x e y. Ad esempio, F (x, y) = 3x 2 + 5xy + 2y 2 o F (x, y) = x 2 + 10xy − 7y 2 sono forme<br />
quadratiche.<br />
Una forma quadratica si può scrivere utilizzando prodotti <strong>di</strong> matrici e vettori come<br />
F (x, y) = ( x y ) ( ) ( )<br />
a 11 a 12 x<br />
a 21 a 22 y<br />
dove il vettore <strong>di</strong> componenti ( (x, y) ) è scritto prima come vettore riga e poi come vettore<br />
a11 a<br />
colonna. La matrice A =<br />
12<br />
è la matrice dei coefficienti della forma quadratica.<br />
a 21 a 22<br />
Eseguendo il prodotto <strong>di</strong> A con il vettore colonna (x, y) otteniamo:<br />
( ) ( ) ( )<br />
a11 a 12 x a11 x + a<br />
=<br />
12 y<br />
a 22 y a 21 x + a 22 y<br />
a 21<br />
35
4. MASSIMI E MINIMI<br />
Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo<br />
un prodotto scalare tra vettori) ricavando:<br />
( ) ( )<br />
a x y 11 x + a 12 y<br />
= x(a<br />
a 21 x + a 22 y<br />
11 x + a 12 y) + y(a 21 x + a 22 y) = a 11 x 2 + a 12 xy + a 21 xy + a 22 y 2<br />
In definitiva, abbiamo F (x, y) = a 11 x 2 + (a 12 + a 21 )xy + a 22 y 2 .<br />
La matrice dei coefficienti della forma quadratica si può scrivere come una matrice simmetrica<br />
(con a 12 = a 21 ). Se così non fosse, la si può rendere simmetrica prendendo come<br />
coefficiente <strong>di</strong> riga 1 e colonna 2 (e <strong>di</strong> riga 2 e colonna( 1) la semisomma ) dei valori a 12 e a 21<br />
a12 + a 21<br />
della matrice non simmetrica: vale infatti a 12 + a 21 = 2<br />
.<br />
2<br />
Esempio<br />
Es. 4.1.1 Sia F (x, y) = x 2 + 10xy − 7y 2 . Possiamo scrivere questa forma quadratica in<br />
forma matriciale ponendo A in forma non simmetrica:<br />
F (x, y) = ( x y ) ( ( )<br />
1 2 x<br />
8 −7)<br />
y<br />
oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi<br />
extra <strong>di</strong>agonali la semisomma dei corrispondenti elementi della matrice non simmetrica<br />
F (x, y) = ( x y ) ( ( )<br />
1 5 x<br />
5 −7)<br />
y<br />
In entrambi i casi, il risultato è sempre lo stesso, la forma quadratica F (x, y) = x 2 +10xy −<br />
7y 2 .<br />
In generale, una forma quadratica in R 2 viene rappresentata utilizzando una matrice<br />
simmetrica nella forma<br />
F (x, y) = ( x y ) ( ( )<br />
a b x<br />
b c)<br />
y<br />
da cui<br />
F (x, y) = ax 2 + 2bxy + cy 2 .<br />
Nel caso dello spazio R n<br />
seguente.<br />
si generalizza la definizione <strong>di</strong> forma quadratica nel modo<br />
Definizione 4.1.1 Una forma quadratica in R n è un polinomio omogeneo <strong>di</strong> secondo grado<br />
nelle n variabili x 1 , x 2 , . . . , x n , a coefficienti reali. Una forma quadratica si può scrivere come<br />
F (x 1 , x 2 , . . . , x n ) =<br />
n∑<br />
a ij x i x j<br />
i,j=1<br />
In forma matriciale si può scrivere come<br />
⎛<br />
⎞<br />
a 11 a 12 . . . a<br />
⎛ ⎞<br />
1n<br />
F (x 1 , x 2 , . . . , x n ) = ( x 1<br />
)<br />
a 21 a 22 . . . a 2n<br />
x 1 x 2 . . . x n ⎜<br />
⎟ ⎜x 2<br />
⎟<br />
⎝ . . . . . . ⎠ ⎝. . . ⎠<br />
a n1 a n2 . . . a nn<br />
x n<br />
36
4.1. Forme quadratiche<br />
Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come<br />
abbiamo visto in R 2 .<br />
Torniamo ora a considerare forme quadratiche in R 2 visto che lavoreremo soprattutto in<br />
questo spazio.<br />
Definizione 4.1.2 Una forma quadratica F (x, y) si <strong>di</strong>ce<br />
G definita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) > 0;<br />
G semidefinita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) ≥ 0;<br />
G definita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) < 0;<br />
G semidefinita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) ≤ 0;<br />
G indefinita se esistono almeno due punti (x 1 , y 1 ) e (x 2 , y 2 ) tali che F (x 1 , y 1 ) > 0 e F (x 2 , y 2 ) <<br />
0.<br />
Come fare a capire se una forma quadratica è definita positiva, negativa o indefinita<br />
Abbiamo il seguente teorema.<br />
Teorema 4.1.1 Data la forma quadrata F (x, y) = ax 2 + 2bxy + cy 2 :<br />
G se det(A) = ac − b 2 > 0 e a > 0 allora F (x, y) è definita positiva;<br />
G se det(A) = ac − b 2 > 0 e a < 0 allora F (x, y) è definita negativa;<br />
G se det(A) = ac − b 2 < 0 allora F (x, y) è indefinita.<br />
Vale anche il viceversa:<br />
G se F (x, y) è definita positiva allora det(A) = ac − b 2 > 0 e a > 0;<br />
G se F (x, y) è definita negativa allora det(A) = ac − b 2 > 0 e a < 0;<br />
G se F (x, y) è indefinita allora det(A) = ac − b 2 < 0.<br />
Dimostrazione. Ricor<strong>di</strong>amo innanzitutto che det(A) rappresenta il determinante della<br />
matrice A che caratterizza la forma quadratica e che vale det(A) = ac − b 2 .<br />
Scriviamo ora la forma quadratica mettendo in evidenza il coefficiente a e aggiungendo e<br />
sottraendo b2<br />
a 2 y2 , otteniamo:<br />
F (x, y) = ax 2 + 2bxy + cy 2<br />
= a<br />
(x 2 + 2 b a xy + c )<br />
a y2<br />
= a<br />
(x 2 + 2 b b2<br />
xy +<br />
a a 2 y2 − b2<br />
a 2 y2 + c )<br />
a y2<br />
Osserviamo che x 2 + 2 b b2<br />
xy +<br />
a a 2 y2 = (x + b a y)2 . Inoltre − b2<br />
a 2 y2 + c a y2 =<br />
Abbiamo dunque<br />
F (x, y) = a<br />
((x + b )<br />
ac −<br />
a y)2 b2<br />
+<br />
a 2 y 2<br />
ac − b2<br />
a 2 y 2 .<br />
La forma quadratica è dunque data dal prodotto <strong>di</strong> a per la somma <strong>di</strong> due termini: il termine<br />
(x + b ac −<br />
a y)2 b2<br />
è il quadrato <strong>di</strong> un binomio ed è sempre positivo; il termine<br />
a 2 y 2 può essere<br />
positivo o negativo a seconda del segno <strong>di</strong> ac − b 2 .<br />
Se a > 0 e ac − b 2 > 0 allora la forma quadratica è sempre maggiore <strong>di</strong> zero e quin<strong>di</strong> è<br />
definita positiva.<br />
Se a < 0 e ac − b 2 > 0, la forma quadratica è definita negativa.<br />
Se invece ac − b 2 < 0 possiamo avere valori <strong>di</strong> (x, y) per cui la forma quadratica è positiva<br />
e altri valori per cui la forma quadratica è negativa.<br />
37
4. MASSIMI E MINIMI<br />
Viceversa, supponiamo che la F sia definita positiva, negativa o indefinita. Mettiamo in<br />
evidenza il termine y 2 nella forma quadratica. Si ha<br />
(<br />
)<br />
F (x, y) = y 2 a x2<br />
y 2 + 2bx y + c<br />
Poniamo t = x y<br />
in modo da poter scrivere<br />
F (x, y) = y 2 (at 2 + 2bt + c)<br />
Supponiamo che la forma quadratica sia definita positiva: vuol <strong>di</strong>re che y 2 (at 2 + 2bt + c) > 0<br />
per ogni coppia (x, y) ≠ (0, 0), quin<strong>di</strong> deve essere at 2 + 2bt + c > 0 per ogni t: questo si ha con<br />
a > 0 e con il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t negativo, cioè 4b 2 − 4ac < 0,<br />
vale a <strong>di</strong>re ac − b 2 > 0.<br />
Se invece la forma quadratica è definita negativa, vuol <strong>di</strong>re che at 2 + 2bt + c < 0 per ogni<br />
valore <strong>di</strong> t, quin<strong>di</strong> deve essere a < 0 e il <strong>di</strong>scriminante negativo, quin<strong>di</strong> ancora ac − b 2 > 0.<br />
Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori<br />
negativi, perciò il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t deve essere positivo,<br />
cioè ac − b 2 < 0. 1 ✔<br />
Nel caso <strong>di</strong> forme quadratiche in R n , l’analogo teorema per vedere se una forma quadratica<br />
è definita positiva, negativa o indefinita è dato dal teorema <strong>di</strong> Sylvester, che considera i<br />
determinanti <strong>di</strong> tutti i minori principali delle matrice A che definisce la forma quadratica.<br />
Definizione 4.1.3 Data A matrice <strong>di</strong> n righe e n colonne, si definisce minore principale <strong>di</strong><br />
or<strong>di</strong>ne k e si in<strong>di</strong>ca con A k la matrice che si forma dalla matrice A prendendo le prime k righe<br />
e k colonne della matrice stessa.<br />
⎛<br />
Quin<strong>di</strong> A 1 = (a 11 ), A 2 =<br />
( )<br />
a11 a 12<br />
, A<br />
a 21 a k =<br />
22<br />
⎞<br />
a 11 a 12 . . . a 1k<br />
a 21 a 22 . . . a 2k<br />
⎜<br />
⎟<br />
⎝ . . . . . . ⎠ .<br />
a k1 a k2 . . . a kk<br />
Teorema 4.1.2 (<strong>di</strong> Sylvester) Data una forma quadratica in R n , F (x 1 , x 2 , . . . , x n ) =<br />
∑ n<br />
i,j=1 a ijx i x j , allora<br />
G F è definita positiva se e solo se det(A k ) > 0 per ogni k = 1, 2, . . . , n;<br />
G F è definita negativa se e solo se (−1) k det(A k ) > 0 per ogni k = 1, 2, . . . , n.<br />
1 Per la seconda parte <strong>di</strong> questo teorema ci siamo rifatti alle note proprietà:<br />
G ax 2 + bx + c = 0<br />
– se ∆ = b 2 − 4ac < 0 ⇒ non esistono ra<strong>di</strong>ci reali all’equazione;<br />
– se ∆ = 0 ⇒ le ra<strong>di</strong>ci sono coincidenti x 1 = x 2 = −b<br />
2a ;<br />
– se ∆ > 0 ⇒ esistono due ra<strong>di</strong>ci reali e <strong>di</strong>stinte date da −b ± √ ∆<br />
.<br />
2a<br />
G ax 2 + bx + c > 0, a > 0<br />
– se ∆ = b 2 − 4ac < 0 ⇒ l’insieme delle soluzioni che sod<strong>di</strong>sfano la <strong>di</strong>sequazione data è tutto R<br />
– se ∆ = 0 ⇒ l’insieme delle soluzioni è tutto R privato della ra<strong>di</strong>ce dell’equazione ax 2 + bx + c = 0<br />
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori esterni all’intervallo delle due ra<strong>di</strong>ci dell’equazione<br />
<strong>di</strong> secondo grado.<br />
G ax 2 + bx + c < 0, a > 0<br />
– se ∆ ≤ 0 ⇒ non ci sono soluzioni per questa <strong>di</strong>sequazione;<br />
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori interni all’intervallo delle due ra<strong>di</strong>ci dell’equazione.<br />
38
4.2. Massimi e minimi<br />
4.2 Massimi e minimi<br />
Per funzioni scalari, le derivate della funzione aiutano a capire e a trovare i suoi valori<br />
massimi e minimi e i punti in cui la funzione assume tali valori. Per funzioni <strong>di</strong> due variabili,<br />
sono <strong>di</strong> aiuto le derivate parziali.<br />
Definizione 4.2.1 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />
I ⊂ R 2 .<br />
G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />
f(x, y) ≤ f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />
massimo assoluto della funzione.<br />
G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />
f(x, y) < f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 )<br />
si <strong>di</strong>ce massimo assoluto proprio della funzione.<br />
Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo assoluto e minimo<br />
assoluto proprio.<br />
G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />
f(x, y) ≥ f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />
minimo assoluto della funzione.<br />
G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />
f(x, y) > f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />
<strong>di</strong>ce minimo assoluto proprio della funzione.<br />
Se queste definizioni valgono non in tutto l’insieme <strong>di</strong> definizione della funzione f ma localmente,<br />
in un intorno <strong>di</strong> P 0 , allora si ottengono le definizioni <strong>di</strong> punto <strong>di</strong> massimo (o minimo)<br />
relativo (o relativo proprio).<br />
Definizione 4.2.2 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />
I ⊂ R 2 .<br />
G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />
ogni P (x, y) ∈ A r (P 0 ), risulta<br />
f(x, y) ≤ f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />
massimo relativo della funzione.<br />
G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />
ogni P (x, y) ∈ A r (P 0 ), P ≠ P 0 , risulta<br />
f(x, y) < f(x 0 , y 0 )<br />
allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />
<strong>di</strong>ce massimo relativo della funzione.<br />
39
4. MASSIMI E MINIMI<br />
Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo relativo e minimo<br />
relativo proprio.<br />
Definizione 4.2.3 I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si<br />
chiamano anche estremi (assoluti e relativi) della funzione.<br />
Un punto <strong>di</strong> estremo relativo interno all’insieme <strong>di</strong> definizione della funzione f si chiama<br />
punto <strong>di</strong> estremo relativo interno.<br />
Teorema 4.2.1 Se una funzione f : I −→ R, con I ⊂ R 2 , I aperto, f ∈ C 1 (I), ammette un<br />
punto <strong>di</strong> massimo o minimo relativo interno nel punto P 0 (x 0 , y 0 ) allora esistono le derivate<br />
parziali della f in P 0 e vale f x (P 0 ) = f y (P 0 ) = 0<br />
Dimostrazione. Sia P 0 (x 0 , y 0 ) un punto <strong>di</strong> massimo (o minimo) relativo interno. Poniamo<br />
g(x) = f(x, y 0 ). Come conseguenza la funzione g ammette in x = x 0 un punto <strong>di</strong> massimo (o<br />
minimo) relativo interno e, quin<strong>di</strong>, g ′ (x 0 ) = 0. Ma g ′ (x 0 ) = f x (x 0 , y 0 ). Perciò vale f x (x 0 , y 0 ) = 0.<br />
Allo stesso modo, posto h(y) = f(x 0 , y), si ha che y 0 è punto <strong>di</strong> massimo (o minimo) relativo<br />
interno per la funzione h, da cui h ′ (y 0 ) = 0. Ma h ′ (y 0 ) = f y (x 0 , y 0 ) e quin<strong>di</strong> f y (x 0 , y 0 ) = 0. ✔<br />
Perciò, se P 0 è un punto <strong>di</strong> estremo relativo interno per la funzione f, necessariamente il<br />
gra<strong>di</strong>ente della f in P 0 è il vettore nullo:<br />
⃗∇(f)(P 0 ) = (00).<br />
Non vale il viceversa, tuttavia se dobbiamo cercare i punti <strong>di</strong> massimo e minimo relativo<br />
interni all’insieme <strong>di</strong> definizione <strong>di</strong> una funzione, dobbiamo analizzare quei punti che hanno<br />
il gra<strong>di</strong>ente nullo perchè tra questi ci saranno i punti <strong>di</strong> massimo e minimo relativi. Se<br />
l’insieme <strong>di</strong> definizione della funzione è un insieme aperto, i punti <strong>di</strong> massimo e minimo<br />
relativo sono tutti punti interni all’insieme <strong>di</strong> definizione.<br />
Vale la seguente definizione.<br />
Definizione 4.2.4 Un punto P 0 (x 0 , y 0 ) tale che ∇(f)(P ⃗ 0 ) = (00) si <strong>di</strong>ce punto critico (o<br />
stazionario) della funzione f.<br />
4.3 Ricerca <strong>di</strong> massimi e minimi relativi<br />
Per capire se una funzione ha un punto <strong>di</strong> massimo o minimo relativo in un suo punto<br />
critico, viene in aiuto il cosiddetto test sulle derivate seconde. A tale scopo introduciamo la<br />
seguente definizione.<br />
Definizione 4.3.1 Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I aperto, e dato un punto P 0 ∈ I,<br />
si definisce hessiano della f in P 0 il determinante H f (P 0 ) della matrice<br />
( )<br />
fxx (P 0 ) f xy (P 0 )<br />
f xy (P 0 ) f yy (P 0 )<br />
Poichè la funzione è <strong>di</strong> classe C 2 , vale f xy = f yx .<br />
Quin<strong>di</strong><br />
H f (P 0 ) =<br />
∣ f xx(P 0 ) f xy (P 0 )<br />
f xy (P 0 ) f yy (P 0 ) ∣ = f xx(P 0 )f yy (P 0 ) − (f xy (P 0 )) 2<br />
Teorema 4.3.1 (Test sulle derivate seconde) Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I<br />
aperto, e dato P 0 punto critico per f, avente come hessiano H f (P 0 ) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2 ,<br />
si ha:<br />
40
4.3. Ricerca <strong>di</strong> massimi e minimi relativi<br />
G se H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora P 0 è un punto <strong>di</strong> minimo relativo interno proprio e f(P 0 )<br />
è un valore <strong>di</strong> minimo relativo;<br />
G se H f (P 0 ) > 0 e f xx (P 0 ) < 0, allora P 0 è un punto <strong>di</strong> massimo relativo interno proprio e<br />
f(P 0 ) è un valore <strong>di</strong> massimo relativo;<br />
G se H f (P 0 ) < 0 allora P 0 non è nè punto <strong>di</strong> massimo nè punto <strong>di</strong> minimo relativo e si chiama<br />
punto <strong>di</strong> sella.<br />
Osserviamo che se vale H f (P 0 ) = 0, P 0 può essere punto <strong>di</strong> minimo, massimo o <strong>di</strong> sella: bisogna<br />
indagare caso per caso.<br />
Dimostrazione. Per <strong>di</strong>mostrare questo teorema, applichiamo la formula <strong>di</strong> Taylor <strong>di</strong><br />
centro P 0 alla funzione f:<br />
f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />
+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />
Considerando x = x 0 + h e y = y 0 + k, poichè P 0 è un punto critico, la formula si riduce a<br />
f(x 0 + h, y 0 + k) = f(x 0 , y 0 ) + 1 2 f xx(ξ x , η y )h 2 + f xy (ξ x , η y )hk + 1 2 f yy(ξ x , η y )k 2<br />
= f(x 0 , y 0 ) + 1 2<br />
(<br />
fxx (ξ x , η y )h 2 + 2f xy (ξ x , η y )hk + f yy (ξ x , η y )k 2)<br />
dove (ξ x , η y ) è un punto che non conosciamo, sul segmento <strong>di</strong> estremi P e P 0 .<br />
In un opportuno intorno <strong>di</strong> P 0 , per il teorema della permanenza del segno, se vale<br />
f xx (x 0 , y 0 ) > 0 vale anche f xx (x, y) > 0 nell’intorno <strong>di</strong> P 0 . Alla stessa maniera, sempre per<br />
lo stesso teorema sulla permanenza del segno, se H f (P 0 ) > 0 anche H f (P ) > 0 nell’intorno <strong>di</strong><br />
P 0 .<br />
Supponiamo, allora <strong>di</strong> trovarci nelle ipotesi in cui H f (P 0 ) > 0 e f xx (P 0 ) > 0. Allora la forma<br />
quadratica data da<br />
F 0 (h, k) = f xx (P 0 )h 2 + 2f xy (P 0 )hk + f yy (P 0 )k 2<br />
ha il determinante della matrice ad essa associata che vale det(A) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2<br />
cioè det(A) = H f (P 0 ). Poichè per ipotesi, H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora la forma quadratica<br />
è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno<br />
intorno <strong>di</strong> P 0 , considerando il punto (ξ x , η x ) della formula <strong>di</strong> Taylor: la forma quadratica<br />
data da F ξ,η (h, k) = f xx (ξ x , η y )h 2 +2f xy (ξ x , η y )hk +f yy (ξ x , η y )k 2 è una forma quadratica positiva,<br />
cioè F ξ,η (h, k) > 0. Riprendendo la formula <strong>di</strong> Taylor, in un intorno <strong>di</strong> P 0 risulta quin<strong>di</strong><br />
da cui<br />
cioè<br />
f(x, y) = f(x 0 , y 0 ) + 1 2 F ξ,η(h, k)<br />
f(x, y) − f(x 0 , y 0 ) = 1 2 F ξ,η(h, k) > 0<br />
f(x, y) > f(x 0 , y 0 ).<br />
Il punto P 0 è perciò un punto <strong>di</strong> minimo relativo proprio.<br />
Analogamente si provano gli altri due casi: se l’hessiano in P 0 è positivo e f xx (P 0 ) < 0<br />
allora la forma quadratica associata è definita negativa e, dalla formula <strong>di</strong> Taylor, risulta<br />
che P 0 è un punto <strong>di</strong> massimo relativo. Se invece l’hessiano è negativo, la forma quadratica<br />
41
4. MASSIMI E MINIMI<br />
Figura 4.1: Grafico della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />
associata è indefinita e quin<strong>di</strong> P 0 non può essere nè <strong>di</strong> massimo nè <strong>di</strong> minimo, ma è un<br />
punto <strong>di</strong> sella. ✔<br />
Esempio<br />
Es. 4.3.1 Calcolare i punti <strong>di</strong> massimo e minimo relativo e i corrispondenti valori <strong>di</strong><br />
massimo e minimo della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />
Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole<br />
uguali a zero:<br />
{<br />
f x (x, y) = 4x 3 − 4y = 0<br />
f y (x, y) = 4y 3 − 4x = 0<br />
Dalla prima equazione abbiamo y = x 3 e sostituendo nella seconda equazione ricaviamo<br />
0 = 4(x 9 −x) = 4x(x 8 −1) = 4x(x 4 −1)(x 4 +1) = 4x(x 2 −1)(x 2 +1)(x 4 +1) = 4x(x−1)(x+1)(x 2 +1)(x 4 +1)<br />
Le ra<strong>di</strong>ci reali sono tre x = 0, x = 1, x = −1, che, insieme alla relazione y = x 3 , ci danno i<br />
tre punti critici P 0 (0, 0), P 1 (1, 1) e P 2 (−1, −1).<br />
Per ciascuno <strong>di</strong> questi punti critici applichiamo il teorema del test sulle derivate seconde.<br />
In questo caso le derivate parziali seconde sono:<br />
f xx = 12x 2 , f xy = −4, f yy = 12y 2<br />
Per il punto P 0 abbiamo H f (P 0 ) = −16 < 0, quin<strong>di</strong> possiamo <strong>di</strong>re subito che P 0 è un punto<br />
<strong>di</strong> sella.<br />
Per P 1 si ha H f (P 1 ) = 128 > 0, f xx (P 1 ) = 12 > 0, quin<strong>di</strong> P 1 è un punto <strong>di</strong> minimo relativo<br />
interno proprio con valore minimo f(P 1 ) = 0.<br />
Per P 2 vale H f (P 2 ) = 128 > 0, f xx (P 2 ) = 12 > 0, quin<strong>di</strong> P 2 è un altro punto <strong>di</strong> minimo<br />
relativo interno proprio con valore minimo f(P 2 ) = 0.<br />
In Figura 4.1 possiamo osservare come P 1 e P 2 siano punti <strong>di</strong> minimo mentre P 0 è un<br />
punto <strong>di</strong> sella.<br />
42
4.4. Sui massimi e minimi assoluti<br />
Figura 4.2: Grafico della funzione f(x, y) = 2y 2 .<br />
Esempio<br />
Es. 4.3.2 Consideriamo ora la funzione f(x, y) = 2y 2 e cerchiamo i punti <strong>di</strong> massimo e<br />
minimo relativo. Per i punti critici, imponiamo che il gra<strong>di</strong>ente della funzione sia uguale<br />
a zero, quin<strong>di</strong><br />
{<br />
f x = 0<br />
f y = 4y = 0<br />
La f x vale sempre zero perchè la f non <strong>di</strong>pende da x, Dalla seconda equazione ricaviamo<br />
y = 0, da cui i punti critici della funzione sono tutti i punti <strong>di</strong> coor<strong>di</strong>nate (x, 0), cioè tutti i<br />
punti dell’asse delle x.<br />
An<strong>di</strong>amo a calcolare l’Hessiano in questi punti. Poichè f xx = 0, f xy = 0, e f yy = 4, segue<br />
che H f (x, 0) = 0. Quin<strong>di</strong> il teorema sul test delle derivate seconde non ci può <strong>di</strong>re nulla.<br />
In tal caso, dobbiamo vedere come è fatta la funzione e cercare <strong>di</strong> capire cosa succede in<br />
un intorno <strong>di</strong> questi punti critici.<br />
Fissato x = x 0 , per il punto (x 0 , 0), in un suo qualunque intorno vale f(x, y) = 2y 2 ≥ 0 =<br />
f(x 0 , 0) (posso prendere anche un punto che ha y = 0 ma x ≠ x 0 ). Si conclude quin<strong>di</strong><br />
che (x 0 , 0) è un punto <strong>di</strong> minimo relativo. Questo vale per tutti i punti (x, 0), che sono,<br />
dunque, tutti punti <strong>di</strong> minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare<br />
i risultati.<br />
4.4 Sui massimi e minimi assoluti<br />
Per funzioni scalari, il teorema <strong>di</strong> Weierstrass assicura che se una funzione è continua in<br />
un intervallo chiuso e limitato allora essa ammette massimo e minimo (assoluti).<br />
Lo stesso teorema vale anche per funzioni <strong>di</strong> più variabili.<br />
Teorema 4.4.1 (<strong>di</strong> Weierstrass) Data una funzione continua f : I −→ R, con I ⊂ R 2 , I<br />
insieme chiuso e limitato (quin<strong>di</strong> compatto), la f ammette massimo e minimo (assoluti) in I.<br />
43
4. MASSIMI E MINIMI<br />
Questo teorema è utile per trovare massimi e minimi assoluti <strong>di</strong> una funzione continua<br />
in un insieme compatto I. Si può applicare questo metodo:<br />
1. si calcola il valore della f nei punti critici della f che si trovano all’interno <strong>di</strong> I;<br />
2. si stu<strong>di</strong>a la funzione sulla frontiera <strong>di</strong> I e si cercano i valori estremi della f sulla<br />
frontiera;<br />
3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della<br />
funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della<br />
funzione. I corrispondenti punti sono rispettivamente i punti <strong>di</strong> massimo e minimo<br />
assoluti della funzione.<br />
Osserviamo, quin<strong>di</strong>, che la procedura per trovare i valori estremi assoluti <strong>di</strong> una funzione,<br />
in un insieme compatto, è <strong>di</strong>versa dalla procedura per trovare gli estremi relativi <strong>di</strong> una<br />
funzione me<strong>di</strong>ante il test delle derivate seconde.<br />
A volte, si cercano sia gli estremi assoluti sia gli estremi relativi <strong>di</strong> una funzione e, in<br />
questo caso, vanno seguite entrambe le strade.<br />
Esempio<br />
Es. 4.4.1 Si devono trovare gli estremi assoluti della funzione f(x, y) = x 2 − 4xy + 4y sul<br />
rettangolo D = {(x, y) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 4}.<br />
L’insieme D è un insieme chiuso e limitato (il rettangolo <strong>di</strong> vertici A(0, 0), B(2, 0), C(2, 4),<br />
D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema<br />
<strong>di</strong> Weierstrass, quin<strong>di</strong> esistono il massimo e il minimo assoluti della funzione in D.<br />
Cerchiamo i punti critici interni: da f x = 2x − 4y e f y = −4x + 4, ponendo queste derivate<br />
uguali a zero abbiamo il sistema <strong>di</strong> equazioni<br />
{<br />
2x − 4y = 0<br />
4 − 4x = 0<br />
Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = 1 2 . Otteniamo<br />
il punto critico P 0 (1, 1 2 ). Il punto P 0 si trova all’interno dell’insieme D (se così non fosse<br />
non lo dovremmo prendere in considerazione). Calcoliamo f(P 0 ) = 1. Non dobbiamo vedere<br />
se questo è un punto <strong>di</strong> massimo o minimo relativo (non è richiesto), quin<strong>di</strong> passiamo<br />
a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche<br />
gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La<br />
frontiera dell’insieme I è dato dall’unione dei segmenti AB, BC, CD e DA.<br />
Il segmento AB ha equazione y = 0 con 0 ≤ x ≤ 2. Su questo segmento la funzione f si<br />
riduce ad una funzione della sola variabile x, g(x) = f(x, 0) = x 2 , con 0 ≤ x ≤ 2. Si vede<br />
facilmente (poichè g ′ (x) = 2x ≥ 0 nell’intervallo dato) che la g è una funzione crescente<br />
in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2<br />
(g(2) = 4). Quin<strong>di</strong> dal segmento AB dobbiamo ricordare i punti A e B dove la funzione<br />
vale 0 e 4 rispettivamente.<br />
Il segmento BC ha equazione x = 2 con 0 ≤ y ≤ 4. Qui la funzione si riduce a h(y) =<br />
f(2, y) = 4−8y +4y = 4−4y nell’intervallo [0, 4]. La funzione è decrescente (h ′ (y) = −4 < 0),<br />
quin<strong>di</strong> assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = −12). Per y = 0<br />
ritroviamo il punto B, per y = 4 troviamo il vertice C.<br />
Sul segmento CD, <strong>di</strong> equazione y = 4, con 0 ≤ x ≤ 2, la funzione <strong>di</strong>venta g(x) = f(x, 4) =<br />
x 2 − 16x + 16 per x ∈ [0, 2]. La derivata g ′ (x) = 2x − 16 si annulla per x = 8 che è un punto<br />
all’esterno dell’intervallo in cui deve variare la x (se fosse all’interno avremmo trovato<br />
un punto critico da considerare ai fini del calcolo <strong>degli</strong> estremi della f). Si ha g ′ (x) < 0<br />
per 2x − 16 < 0 cioè x < 8: quin<strong>di</strong> nell’intervallo [0, 2] la g è decrescente e assume valore<br />
massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = −12). Per x = 0 abbiamo il vertice D,<br />
per x = 2 ritroviamo C.<br />
44
4.5. Funzioni implicite<br />
Figura 4.3: Grafico della funzione f(x, y) = x 2 − 4xy + 4y nell’insieme compatto [0, 2] × [0, 4].<br />
Arriviamo infine al segmento AD dato dall’equazione x = 0, per 0 ≤ y ≤ 4. La funzione<br />
<strong>di</strong>venta h(y) = f(0, y) = 4y. La funzione è crescente e assume valore minimo e massimo<br />
rispettivamente agli estremi 0 e 4. Ritroviamo i punti A e D.<br />
Quin<strong>di</strong> i valori da confrontare sono: P 1 (1, 1 2 ) dove f(P 1) = 1, A dove f(A) = 0, B con<br />
f(B) = 4, C dove f(C) = −12, e D con f(D) = 16.<br />
Dal confronto segue che il massimo assoluto vale 16 e punto <strong>di</strong> massimo assoluto è D,<br />
mentre il minimo assoluto è −12 con punto <strong>di</strong> minimo assoluto C.<br />
4.5 Funzioni implicite<br />
Nello stu<strong>di</strong>are funzioni scalari, abbiamo visto funzioni del tipo y = f(x): la variabile y è<br />
funzione esplicita della variabile y:<br />
y = sin (x), y = √ x 3 + 2, y = ln x + 4, . . . . . .<br />
Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y<br />
come, ad esempio,<br />
x 2 + y 2 = 9 o x 3 + y 3 = 12xy o xye xy2 + 3ye −x = 0 o . . .<br />
In alcuni casi è possibile risolvere questo tipo <strong>di</strong> equazioni scrivendo y come una funzione<br />
esplicita (o più funzioni esplicite) <strong>di</strong> x.<br />
Nel caso <strong>di</strong> x 2 + y 2 = 9, si ottiene y = ± √ √ 9 − x 2 , quin<strong>di</strong> due troviamo due funzioni f(x) =<br />
9 − x2 e g(x) = − √ 9 − x 2 . I grafici della f e della g sono rispettivamente il semicerchio<br />
superiore e inferiore della circonferenza x 2 + y 2 = 9 e, insieme, ci danno il grafico <strong>di</strong> tutta la<br />
circonferenza.<br />
Non è altrettanto facile trovare un’espressione esplicita <strong>di</strong> y come funzione <strong>di</strong> x nel caso<br />
<strong>di</strong> x 3 + y 3 = 12xy: potremmo usare la formula per trovare le ra<strong>di</strong>ci <strong>di</strong> un polinomio <strong>di</strong> terzo<br />
45
4. MASSIMI E MINIMI<br />
grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo<br />
neanche! Ci accontentiamo <strong>di</strong> sapere che è possibile risolvere il problema.<br />
Per la funzione xye xy2 + 3ye −x = 0 non riusciamo a trovare una formula esplicita che ci<br />
permetta <strong>di</strong> scrivere y in funzione <strong>di</strong> x o viceversa x come funzione <strong>di</strong> y.<br />
Si ha quin<strong>di</strong> questo problema: data un’equazione f(x, y) = 0 è possibile scrivere y = g(x)<br />
tale che f(x, g(x)) = 0 In tal caso <strong>di</strong>remo che la y = g(x) è definita implicitamente dalla f. Si<br />
ha la seguente definizione.<br />
Definizione 4.5.1 Data una funzione f(x, y) definita in un sottoinsieme <strong>di</strong> R 2 , <strong>di</strong>ciamo che<br />
la funzione y = g(x) definita in un intervallo <strong>di</strong> R è definita implicitamente dall’equazione<br />
f(x, y) = 0 se, per ogni x che appartiene all’intervallo <strong>di</strong> definizione della g, si ha che<br />
G il punto (x, g(x)) appartiene all’insieme <strong>di</strong> definizione della f;<br />
G f(x, g(x)) = 0.<br />
Dire f(x, y) = 0 vuol <strong>di</strong>re intersecare il grafico della superficie della funzione f con il piano<br />
z = 0, cioè con il piano xy, ricavandone quin<strong>di</strong> una curva. Per tutti quei punti per cui<br />
(x, g(x)) ∈ I e f(x, g(x)) = 0 il grafico della g coincide con il grafico della curva f(x, y) = 0.<br />
Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il<br />
seguente teorema.<br />
Teorema 4.5.1 (delle funzioni implicite o teorema <strong>di</strong> Dini) Sia data una funzione f :<br />
I −→ R con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) ≠ 0.<br />
Allora esiste un’unica funzione y = g(x) definita in un opportuno intorno <strong>di</strong> x 0 (]x 0 − ɛ, x 0 + ɛ[),<br />
<strong>di</strong> classe C 1 , tale che, per ogni x ∈]x 0 − ɛ, x 0 + ɛ[ risulta<br />
G y 0 = g(x 0 )<br />
G (x, g(x)) ∈ I<br />
G f(x, g(x)) = 0<br />
G g ′ (x) = − f x(x, g(x))<br />
f y (x, g(x)) .<br />
La formula della derivata prima <strong>di</strong> g si ottiene applicando le regole <strong>di</strong> derivazione per le<br />
funzioni composte. Poichè f y (x 0 , y 0 ) ≠ 0, per il teorema della permanenza del segno si ha<br />
f y (x, g(x)) ≠ 0 in un intorno <strong>di</strong> (x 0 , y 0 ). Deriviamo ambo i membri dell’equazione f(x, g(x)) = 0<br />
rispetto alla variabile x (è come se avessimo x = t, y = g(x) = g(t) ma continuiamo a chiamare<br />
la variabile t con x). Abbiamo<br />
df<br />
dx = 0<br />
Ma (considerando che dx<br />
dx = 1)<br />
Dunque<br />
df<br />
dx = f x(x, g(x)) + f y (x, g(x))g ′ (x).<br />
f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />
Poichè, per l’ipotesi f y (x 0 , y 0 ) ≠ 0 (quin<strong>di</strong> anche f y (x, g(x)) ≠ 0) possiamo <strong>di</strong>videre tutto per f y<br />
ricavando<br />
g ′ (x) = − f x(x, g(x))<br />
f y (x, g(x))<br />
Osserviamo che il teorema <strong>di</strong> Dini dà una con<strong>di</strong>zione sufficiente ma non necessaria per<br />
l’esistenza e unicità delle funzioni implicite.<br />
46
4.5. Funzioni implicite<br />
Come conseguenza del teorema, possiamo ricavare l’equazione della retta tangente alla<br />
funzione y = g(x) definita implicitamente dalla f nel punto x 0 . Infatti l’equazione della retta<br />
tangente in x 0 per la funzione g è data da<br />
y − g(x 0 ) = g ′ (x 0 )(x − x 0 ) cioè y − y 0 = − f x(x 0 , y 0 )<br />
f y (x 0 , y 0 ) (x − x 0)<br />
Moltiplicando ambo i membri per f y (x 0 , y 0 ) troviamo<br />
f y (x 0 , y 0 )(y − y 0 ) = −f x (x 0 , y 0 )(x − x 0 ) da cui f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />
Quest’ultima relazione <strong>di</strong>ce che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta<br />
tangente alla curva f(x, y) = 0 in P 0 .<br />
4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta<br />
Facciamo un breve richiamo <strong>di</strong> geometria analitica per comprendere meglio che la<br />
relazione<br />
f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />
scritta prima significa <strong>di</strong>re che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta tangente<br />
a f(x, y) = 0 in P 0 .<br />
Sia assegnata una retta nello spazio R 2 e sia P 0 = (x 0 , y 0 ) un punto che giace sulla retta.<br />
Sia ⃗n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpen<strong>di</strong>colare) alla<br />
retta: il vettore è detto vettore normale.<br />
Sia dato un altro generico punto P = (x, y) sulla retta.<br />
In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si veda<br />
figura 4.4). Il segmento P P 0 è dato dal vettore ⃗r − ⃗r 0 .<br />
Figura 4.4: retta nel piano<br />
Ora, poichè ⃗n è ortogonale alla retta, esso è ortogonale al vettore ⃗r − ⃗r 0 , cioè il prodotto<br />
scalare tra i due vettori è nullo:<br />
⃗n · (⃗r − ⃗r 0 ) = 0<br />
Poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 ), il prodotto scalare <strong>di</strong>venta<br />
a(x − x 0 ) + b(y − y 0 ) = 0<br />
47
4. MASSIMI E MINIMI<br />
Questa che abbiamo scritto rappresenta l’equazione della retta passante 2 per P e P 0 .<br />
Quin<strong>di</strong>, data l’equazione <strong>di</strong> una retta nella forma a(x − x 0 ) + b(y − y 0 ) = 0 il vettore che ha<br />
come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: ⃗n = (a, b).<br />
3<br />
Riprendendo la retta f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0, questa retta rappresenta la<br />
retta tangente a y = g(x) nel punto x 0 . Poichè il grafico della g coincide con il grafico della<br />
curva f(x, y) = 0 nell’intorno <strong>di</strong> x 0 , vuole <strong>di</strong>re che la retta è tangente alla curva f(x, g(x)) = 0<br />
in (x 0 , y 0 ). Il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è dunque ortogonale alla tangente a questa curva.<br />
Dallo stu<strong>di</strong>o <strong>di</strong> g ′ e, eventualmente <strong>di</strong> g ′′ (che si ottiene applicando nuovamente la formula<br />
<strong>di</strong> derivazione delle funzioni composte) possiamo ottenere informazioni sulla funzione g e,<br />
quin<strong>di</strong>, anche su f(x, y) = 0 nell’intorno <strong>di</strong> un punto (x 0 , y 0 ). Lo ve<strong>di</strong>amo con un esempio.<br />
Esempio<br />
Es. 4.5.1 Sia data la funzione f(x, y) = xe 4y + 3y − 1.<br />
Si vuol vedere se nel punto<br />
P 0 (x 0 , y 0 ) = (0, 1 ) sono verificate le ipotesi del teorema <strong>di</strong> Dini e, in caso affermativo,<br />
3<br />
se la funzione y = g(x) definita implicitamente da f(x, y) = 0 è una funzione crescente o<br />
decrescente, concava o convessa in un intorno <strong>di</strong> x 0 .<br />
Calcoliamo f(0, 1 3 ) = 0 + 1 − 1 = 0. Inoltre f y(x, y) = 4xe 4y + 3 e f y (0, 1 3 ) = 3 ≠ 0.<br />
L’altra derivata parziale è f x = e 4y . Le derivate parziali sono continue, quin<strong>di</strong> f ∈ C 1 .<br />
Siamo nelle ipotesi del teorema <strong>di</strong> Dini, quin<strong>di</strong> esiste un’unica funzione y = g(x) definita<br />
in un intorno <strong>di</strong> x 0 = 0 tale che (x, g(x)) appartiente all’insieme <strong>di</strong> definizione della f,<br />
f(x, g(x)) = 0 e g ′ (x) = − f x(x, g(x))<br />
f y (x, g(x)) .<br />
Per vedere se la funzione è crescente o decrescente, calcoliamo g ′ (0). Poichè f x (0, 1 3 ) = e4/3<br />
e f y (0, 1 3 ) = 3, risulta g′ (0) = − e4/3<br />
< 0. Quin<strong>di</strong> la g è decrescente in un intorno <strong>di</strong> 0.<br />
3<br />
Per calcolare g ′′ (0) (e capire quin<strong>di</strong> se la g è convessa o concava) torniamo all’equazione<br />
f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />
e deriviamo ancora rispetto a x, ottenendo<br />
f xx (x, g(x))+f xy (x, g(x))g ′ (x)+f yx (x, g(x))g ′ (x)+f yy (x, g(x))(g ′ (x)) 2 +f y (x, g(x))g ′′ (x) = 0<br />
Nelle ipotesi (verificate in questo esempio) <strong>di</strong> derivate parziali seconde continue, vale<br />
f xy = f yx . Inoltre, f y (x, g(x)) ≠ 0 quin<strong>di</strong><br />
g ′′ (x) = − f xx(x, g(x)) + 2f xy (x, g(x))g ′ (x) + f yy (x, g(x))(g ′ (x)) 2<br />
f y (x, g(x))<br />
2 Spesso troviamo l’equazione scritta nella forma<br />
o ancora<br />
ax + by = d dove d = ax 0 + by 0<br />
y = mx + d dove m = − a b , d = a b x 0 + y 0<br />
3 ⃗n = (−m, 1), se usiamo la rappresentazione della retta me<strong>di</strong>ante y = mx + d.<br />
48
4.6. Curve <strong>di</strong> livello<br />
Adesso possiamo calcolare g ′′ (0). Abbiamo f xx = 0, f xy = 4e 4y , f yy = 16xe 4y , da cui<br />
f xx (P 0 ) = 0, f xy (P 0 ) = 4e 4/3 , f yy = 0, quin<strong>di</strong><br />
8e 4/3 (− e4/3<br />
g ′′ (0) = − 3 )<br />
> 0<br />
3<br />
La funzione è convessa in un intorno <strong>di</strong> 0.<br />
Osserviamo che, se f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) = 0, non possiamo applicare il teorema <strong>di</strong><br />
Dini. Tuttavia, se, oltre a f(x 0 , y 0 ) = 0, si ha f x (x 0 , y 0 ) ≠ 0, si può applicare il teorema <strong>di</strong> Dini,<br />
scambiando il ruolo <strong>di</strong> x e y. Si ha la seguente formulazione<br />
Teorema 4.5.2 (<strong>di</strong> Dini, scambiando il ruolo <strong>di</strong> x e y) Sia data una funzione f : I −→ R<br />
con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f x (x 0 , y 0 ) ≠ 0. Allora<br />
esiste un’unica funzione x = h(y) definita in un opportuno intorno <strong>di</strong> y 0 (]y 0 − ɛ, y 0 + ɛ[), <strong>di</strong> classe<br />
C 1 , tale che, per ogni y ∈]y 0 − ɛ, y 0 + ɛ[ risulta<br />
G x 0 = h(y 0 )<br />
G (h(y), y) ∈ I<br />
G f(h(y), y) = 0<br />
G h ′ (y) = − f y(h(y), y)<br />
f x (h(y), y) .<br />
Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare<br />
l’equazione della retta tangente o la sua derivata seconda.<br />
4.6 Curve <strong>di</strong> livello<br />
Un metodo per visualizzare una funzione <strong>di</strong> due variabili è quello usato per <strong>di</strong>segnare le<br />
mappe geografiche, dove i punti che hanno la stessa altezza sono uniti insieme in modo da<br />
formare le cosiddette curve <strong>di</strong> livello o linee isometriche (contour lines).<br />
Definizione 4.6.1 Si definiscono curve <strong>di</strong> livello <strong>di</strong> una funzione f <strong>di</strong> due variabili, tutte le<br />
curve <strong>di</strong> equazioni f(x, y) = c con c costante che appartiene all’insieme dei valori della f.<br />
La curva <strong>di</strong> livello f(x, y) = c è quin<strong>di</strong> l’insieme <strong>di</strong> tutti i punti del dominio della f in cui la<br />
funzione assume il valore assegnato c. Mostra, quin<strong>di</strong>, dove il grafico della f ha altezza c.<br />
In Figura 4.5 troviamo un esempio <strong>di</strong> applicazione delle curve <strong>di</strong> livello per rappresentare<br />
la temperatura in Europa. Ciascuna curva rappresenta un valore <strong>di</strong>verso <strong>di</strong> temperatura.<br />
Per funzioni matematiche, un esempio <strong>di</strong> curve <strong>di</strong> livello si vede in Figura 4.6 dove, a sinistra,<br />
vi è la superficie data da z = √ x 2 + y 2 mentre, a destra, sono rappresentate le sue curve <strong>di</strong><br />
livello.<br />
Proposizione 4.6.1 Dato un valore c e P 0 = (x 0 , y 0 ) tale che f(x 0 , y 0 ) = c nell’ipotesi che P 0<br />
non sia critico per la f, allora il gra<strong>di</strong>ente ⃗ ∇(f)(P 0 ) è ortogonale alla curva <strong>di</strong> livello f(x, y) = c<br />
in P 0 .<br />
Dimostrazione. Per la <strong>di</strong>mostrazione, ci riconduciamo al teorema <strong>di</strong> Dini delle funzioni<br />
implicite, considerando F (x, y) = f(x, y) − c.<br />
Per ipotesi P 0 non è punto critico, quin<strong>di</strong> almeno una delle due derivate parziali è non<br />
nulla in P 0 . Consideriamo il caso in cui f y (x 0 , y 0 ) ≠ 0.<br />
Allora F (x 0 , y 0 ) = 0, mentre F y (x, y) = f y (x, y) da cui F y (x 0 , y 0 ) = f y (x 0 , y 0 )<br />
49
4. MASSIMI E MINIMI<br />
Figura 4.5: Curve <strong>di</strong> livello nelle mappe <strong>di</strong> meteorologia.<br />
Figura 4.6: Superficie f(x, y) = √ x 2 + y 2 (a sinistra) e le sue curve <strong>di</strong> livello (a destra).<br />
Essendo sod<strong>di</strong>sfatte le ipotesi del teorema <strong>di</strong> Dini, esiste un’unica funzione definita implicitamente<br />
dalla F , y = g(x). Allora l’equazione della retta tangente alla F in P 0 ha<br />
equazione<br />
F x (x 0 , y 0 )(x − x 0 ) + F y (x 0 , y 0 )(y − y 0 ) = 0<br />
Con lo stesso ragionamento fatto prima F x (x, y) = f x (x, y) da cui ricaviamo<br />
f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />
Quin<strong>di</strong> il vettore ⃗ ∇f(P 0 ) è un vettore perpen<strong>di</strong>colare (normale) alla retta tangente alla<br />
curva f(x, y) = c nel punto P 0 . ✔<br />
4.6.1 Significato del vettore gra<strong>di</strong>ente<br />
Consideriamo una funzione f <strong>di</strong>fferenziabile. Da quanto abbiamo appena visto, il vettore<br />
gra<strong>di</strong>ente nel punto P 0 (x 0 , y 0 ), ⃗ ∇f(P 0 ), è perpen<strong>di</strong>colare alla retta tangente alla curva f(x, y) =<br />
50
4.6. Curve <strong>di</strong> livello<br />
Figura 4.7: Sul prodotto scalare.<br />
c che passa per P 0 . Più brevemente, possiamo <strong>di</strong>re che è perpen<strong>di</strong>colare alla curva <strong>di</strong> livello.<br />
Il vettore gra<strong>di</strong>ente fornisce anche informazioni sulla <strong>di</strong>rezione <strong>di</strong> massima crescita della<br />
funzione f. Infatti, dal momento che la derivata <strong>di</strong>rezionale <strong>di</strong>ce la velocità <strong>di</strong> cambiamento<br />
della f in quella <strong>di</strong>rezione, noi possiamo calcolare la derivata <strong>di</strong>rezionale della f in P 0 lungo<br />
tutte le possibili <strong>di</strong>rezioni e vedere qual è il valore massimo e per quale <strong>di</strong>rezione si ottiene.<br />
Per la formula del gra<strong>di</strong>ente, si ha (considerando ⃗v vettore unitario)<br />
∂f(P 0 )<br />
∂⃗v<br />
= ⃗ ∇f(P 0 ) · ⃗v = | ⃗ ∇f(P 0 )||⃗v| cos θ = | ⃗ ∇f(P 0 )| cos θ<br />
dove θ è l’angolo in<strong>di</strong>viduato dai vettori ∇f(P ⃗ 0 ) e ⃗v. Osserviamo che il prodotto scalare<br />
scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando<br />
le componenti dei vettori. 4 Poichè il massimo valore <strong>di</strong> cos θ è 1 e questo si ha quando θ = 0,<br />
vuol <strong>di</strong>re che il valore massimo della derivata <strong>di</strong>rezionale ∂f(P 0)<br />
vale | ∇f(P<br />
∂⃗v<br />
⃗ 0 )| e si ha quando<br />
θ = 0 cioè quando ⃗v ha la stessa <strong>di</strong>rezione <strong>di</strong> ∇f(P ⃗ 0 ).<br />
4 Proviamo che, dati due vettori ⃗a = (a 1 , a 2 ) e ⃗ b = (b 1 , b 2 ), il prodotto scalare ⃗a · ⃗b = a 1 b 1 + a 2 b 2 si può scrivere,<br />
in modo del tutto equivalente come ⃗a ·⃗b = |⃗a|| ⃗ b| cos θ con θ l’angolo in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b.<br />
A tal proposito ricor<strong>di</strong>amo il teorema <strong>di</strong> Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati<br />
(che scriviamo come vettori) ⃗a e ⃗ b che formano un angolo θ, per il terzo lato ⃗c vale<br />
|⃗c| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos θ<br />
dove |⃗a|, | ⃗ b|, |⃗c| sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo).<br />
Se consideriamo il vettore ⃗a + ⃗ b, applicando sia la regola del parallelogramma sia il teorema <strong>di</strong> Carnot, tenendo<br />
conto che adesso l’angolo compreso tra i due lati è π − θ (si veda Figura 4.7) e che cos (π − θ) = − cos θ, si ha<br />
|⃗a + ⃗ b| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos (π − θ) = |⃗a| 2 + | ⃗ b| 2 + 2|⃗a|| ⃗ b| cos θ<br />
Da questa relazione ricaviamo<br />
|⃗a|| ⃗ b| cos θ = 1 “|⃗a + ⃗ b| 2 − |⃗a| 2 − | ⃗ b| 2”<br />
2<br />
Scrivendo in modo esplicito i moduli dei vettori, |⃗a+ ⃗ b| 2 = (a 1 +b 1 ) 2 +(a 2 +b 2 ) 2 , |⃗a| 2 = (a 1 ) 2 +(a 2 ) 2 e | ⃗ b| 2 = (b 1 ) 2 +(b 2 ) 2 ,<br />
e sostituendo, si ha proprio<br />
|⃗a|| ⃗ b| cos θ = a 1 b 1 + a 2 b 2<br />
Quin<strong>di</strong> il prodotto scalare può essere scritto sia in un modo che nell’altro.<br />
51
4. MASSIMI E MINIMI<br />
4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />
In molti problemi che <strong>di</strong>scendono da applicazioni pratiche, si cerca il massimo o il minimo<br />
<strong>di</strong> una funzione soggetta ad una particolare con<strong>di</strong>zione che viene chiamata vincolo. Si <strong>di</strong>ce,<br />
allora, che si cercano gli estremi vincolati.<br />
Esempio<br />
Es. 4.7.1 Si deve costruire una scatola <strong>di</strong> cartone, priva <strong>di</strong> coperchio, utilizzando 12m 2<br />
(metri quadrati) <strong>di</strong> cartone. Si vuole costruire una scatola con il massimo volume<br />
possibile.<br />
Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza,<br />
larghezza e altezza della scatola).<br />
La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai<br />
12m 2 <strong>di</strong> cartone a <strong>di</strong>sposizione).<br />
La superficie rappresenta il vincolo per la funzione volume <strong>di</strong> cui vogliamo calcolare il<br />
massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in<br />
funzione <strong>di</strong> x e y dalla relazione 2xz + 2yz + xy = 12:<br />
z =<br />
12 − xy<br />
2(x + y)<br />
La funzione V <strong>di</strong>venta una funzione <strong>di</strong> due variabili<br />
12 − xy<br />
V = xyz = xy<br />
2(x + y) = 12xy − x2 y 2<br />
2(x + y)<br />
Cerchiamo, <strong>di</strong> questa funzione, gli estremi relativi e tra questi ve<strong>di</strong>amo se c’è una soluzione<br />
fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere<br />
positive).<br />
Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui<br />
z = 1.<br />
Tuttavia, questa strada non è sempre percorribile. Perciò ve<strong>di</strong>amo cosa si deve fare, in<br />
generale, quando si cercano punti <strong>di</strong> massimo o minimo <strong>di</strong> una funzione soggetta a un<br />
vincolo.<br />
Ve<strong>di</strong>amo il caso in cui dobbiamo cercare i valori estremi <strong>di</strong> una funzione f(x, y) soggetta<br />
al vincolo espresso dall’equazione g(x, y) = c. In maniera del tutto equivalente, possiamo <strong>di</strong>re<br />
che dobbiamo cercare i valori estremi della f(x, y) quando il punto (x, y) deve appartenere<br />
alla curva <strong>di</strong> livello g(x, y) = c. In Figura 4.8 ve<strong>di</strong>amo la curva g(x, y) = c e delle curve <strong>di</strong> livello<br />
della funzione f(x, y). Queste curve <strong>di</strong> livello hanno equazione f(x, y) = k con k = 7, 8, 9, 10, 11.<br />
Se vogliamo cercare il massimo della f(x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il<br />
più grande valore <strong>di</strong> k tale che la curva <strong>di</strong> livello f(x, y) = k interseca g(x, y) = c. Dalla Figura,<br />
si può vedere che questo accade quando le due curve si toccano appena l’una con l’altra,<br />
cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette<br />
tangenti sia a g(x, y) = c sia a f(x, y) = k, nel punto (x 0 , y 0 ), che è il punto in cui g(x, y) = c<br />
e f(x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta<br />
tangente ad una funzione f(x, y) è il gra<strong>di</strong>ente della f, vuol <strong>di</strong>re che ∇f(x ⃗ 0 , y 0 ) e ∇g(x ⃗ 0 , y 0 )<br />
sono vettori paralleli, cioè le loro componenti <strong>di</strong>fferiscono <strong>di</strong> una costante. Seguiremo questo<br />
approccio per il metodo dei moltiplicatori <strong>di</strong> Lagrange.<br />
Teorema 4.7.1 Data una funzione f ∈ C 1 (I), con I ⊂ R 2 aperto, con<strong>di</strong>zione necessaria affinchè<br />
P 0 (x 0 , y 0 ) ∈ I sia un punto <strong>di</strong> massimo o minimo relativo della f soggetta al vincolo<br />
g(x, y) = c è che<br />
G g(x 0 , y 0 ) = c<br />
52
4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />
Figura 4.8: Sul prodotto scalare.<br />
G la matrice<br />
(<br />
fx (P 0 )<br />
)<br />
f y (P 0 )<br />
g x (P 0 ) g y (P 0 )<br />
abbia determinante nullo: f x (P 0 )g y (P 0 ) − g x (P 0 )f y (P 0 ) = 0<br />
Proposizione 4.7.1 Se P 0 (x 0 , y 0 ) è un estremo vincolato della funzione f soggetta al vincolo<br />
g(x, y) = c e se P 0 è punto interno all’insieme <strong>di</strong> definizione della f e non è punto critico nè per<br />
la f nè per la g, allora g(x, y) = c e f(x, y) = f(x 0 , y 0 ) hanno in P 0 la stessa retta tangente.<br />
Dimostrazione. Se scriviamo le equazioni delle rette tangenti a f(x, y) = f(x 0 , y 0 ) e<br />
alla curva g(x, y) = c nel punto P 0 , abbiamo f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) = 0 e g x (P 0 )(x −<br />
x 0 ) + g y (P 0 )(y − y 0 ) = 0. Poichè P 0 è un estemo vincolato, vale la con<strong>di</strong>zione f x (P 0 )g y (P 0 ) −<br />
g x (P 0 )f y (P 0 ) = 0, ma questa relazione rappresenta una con<strong>di</strong>zione <strong>di</strong> parallelismo tra le due<br />
rette tangenti. 5 ✔<br />
Il vincolo si può anche rappresentare come una funzione Φ(x, y) = 0 (caso particolare:<br />
Φ(x, y) = g(x, y) − c). Il teorema si riscrive in maniera del tutto analoga.<br />
La matrice<br />
( )<br />
fx (P 0 ) f y (P 0 )<br />
g x (P 0 ) g y (P 0 )<br />
prende il nome <strong>di</strong> matrice jacobiana della f e della g. Vale infatti la seguente definizione.<br />
Definizione 4.7.1 Date le due funzioni f 1 (x, y) e f 2 (x, y) si definisce matrice jacobiana, la<br />
matrice<br />
⎛ ⎞<br />
∂f 1 ∂f 1<br />
∂(f 1 , f 2 ) ⎜<br />
=<br />
∂x ∂y ⎟<br />
⎝ ⎠<br />
∂(x, y)<br />
∂f 2<br />
∂x<br />
∂f 2<br />
∂y<br />
Si definisce jacobiano, il determinante della matrice jacobiana.<br />
Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una<br />
con<strong>di</strong>zione necessaria ma non sufficiente.<br />
5 Ricor<strong>di</strong>amo che, date due rette ax + by + c = 0 e a ′ x + b ′ y + c ′ = 0 la con<strong>di</strong>zione <strong>di</strong> parallelismo è a a ′ = b b ′ ovvero<br />
ab ′ − a ′ b = 0.<br />
53
4. MASSIMI E MINIMI<br />
Figura 4.9: Curve <strong>di</strong> livello della funzione f(x, y) = x 2 + 4y 2 e il vincolo x 2 + y 2 = 1.<br />
Il metodo dei moltiplicatori <strong>di</strong> Lagrange ci permette <strong>di</strong> trovare gli estremi <strong>di</strong> una funzione<br />
f(x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per<br />
applicare questo metodo deve essere ∇Φ(x, ⃗ y) ≠ 0.<br />
Abbiamo detto che, se P 0 è un punto <strong>di</strong> estremo vincolato, il gra<strong>di</strong>ente della f e della<br />
funzione <strong>di</strong> vincolo sono tra loro paralleli, cioè le componenti dei due vettori gra<strong>di</strong>ente<br />
<strong>di</strong>fferiscono per una costante. Introduciamo questa costante me<strong>di</strong>ante la variabile λ detta<br />
moltiplicatore <strong>di</strong> Lagrange: vuol <strong>di</strong>re che f x (x 0 , y 0 ) = λΦ x (x 0 , y 0 ) e f y (x 0 , y 0 ) = λΦ y (x 0 , y 0 ).<br />
Ora, per capire chi possa essere (x 0 , y 0 ), definiamo la funzione H(x, y, λ) = f(x, y)+λΦ(x, y),<br />
che <strong>di</strong>pende dalle variabili x, y e λ. Il metodo dei moltiplicatori <strong>di</strong> Lagrange consiste dei<br />
seguenti passi:<br />
1. risolviamo il sistema <strong>di</strong> equazioni dato da<br />
⃗∇H(x, y, λ) = 0<br />
vale a <strong>di</strong>re:<br />
⎧<br />
⎪⎨ f x (x, y) + λΦ x (x, y) = 0<br />
f y (x, y) + λΦ y (x, y) = 0<br />
⎪⎩<br />
Φ(x, y) = 0<br />
(a meno del segno ritroviamo la con<strong>di</strong>zione <strong>di</strong> parallelismo detta prima);<br />
2. valutiamo la funzione f nella/e soluzione/i trovate e identifichiamo i valori <strong>di</strong> massimo<br />
e minimo, (se esistono).<br />
Esempio<br />
Es. 4.7.2 Si devono cercare i valori estremi della funzione f(x, y) = x 2 + 4y 2 sul cerchio<br />
x 2 + y 2 = 1.<br />
In questo caso il vincolo è dato dall’equazione della circonferenza. Applichiamo il metodo<br />
dei moltiplicatori <strong>di</strong> Lagrange, introducendo la funzione H(x, y, λ) = x 2 +4y 2 +λ(x 2 +y 2 −1)<br />
54
4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />
Il sistema da risolvere è<br />
⎧<br />
⎪⎨ 2x + 2λx = 0<br />
8y + 2λy = 0<br />
⎪⎩<br />
x 2 + y 2 = 1<br />
Dalla prima equazione ricaviamo x = 0 e λ = −1 mentre dalla seconda otteniano y = 0<br />
e λ = −4. Sostituendo x = 0 nella terza equazione (il vincolo) abbiamo y 2 = 1 da cui y =<br />
±1. Sostituendo y = 0 nel vincolo ricaviamo x = ±1. Il valore <strong>di</strong> λ non ci interessa perchè<br />
abbiamo trovato tutti i punti (x, y) che verificano il sistema <strong>di</strong> equazioni. Abbiamo<br />
P 0 (0, 1), P 1 (0, −1), P 2 (1, 0) e P 3 (−1, 0). Calcoliamo la f in questi punti: f(P 0 ) = f(P 1 ) = 4,<br />
f(P 2 ) = f(P 3 ) = 1. Il valore massimo sul vincolo è dato da 4, nei punti P 0 e P 1 . Il<br />
valore minimo sul vincolo è dato da 1 nei punti P 2 e P 3 . Controllando la Figura 4.9<br />
dove ci sono le curve <strong>di</strong> livello della f e la circonferenza, si può vedere come i valori<br />
trovati applicando il metodo dei moltiplicatori <strong>di</strong> Lagrange siano effettivamente quelli<br />
che corrispondono a punti <strong>di</strong> massimo e minimo della f sul vincolo, in quanto le rette<br />
tangenti alla curva <strong>di</strong> livello e alla circonferenza, nei punti trovati, coincidono.<br />
55
CAPITOLO 5<br />
Le curve<br />
A quelli che non conoscono la<br />
matematica è <strong>di</strong>fficile<br />
percepire, come una<br />
sensazione reale, la bellezza, la<br />
profonda bellezza della Natura.<br />
Se volete conoscere la Natura,<br />
apprezzarla, è necessario<br />
comprendere il linguaggio che<br />
essa parla.<br />
Richard Phillips Feynman<br />
(1919-1988)<br />
5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />
5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />
5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />
5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />
5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />
5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />
5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />
5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />
5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />
5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />
5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />
5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />
5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . 79<br />
5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />
5.1 Equazioni parametriche <strong>di</strong> una curva<br />
Supponiamo che una particella si muova lungo una curva γ come quella mostrata in Figura<br />
5.1. Non riusciamo a descrivere la curva me<strong>di</strong>ante un’equazione della forma y = f(x)<br />
(cioè attraverso il grafico <strong>di</strong> una funzione) perchè ci sono <strong>di</strong>verse rette verticali che intersecano<br />
la curva più <strong>di</strong> una volta (mentre per una funzione del tipo y = f(x), ad ogni valore <strong>di</strong><br />
57
5. LE CURVE<br />
Figura 5.1: Una particella che si muove su una curva γ.<br />
x deve corrispondere un solo valore f(x)). Tuttavia, possiamo pensare alle coor<strong>di</strong>nate (x, y)<br />
della particella che si muove lungo la curva come funzioni del tempo t in modo da poter<br />
scrivere x = f(t) e y = g(t). Questa coppia <strong>di</strong> funzioni ci permette <strong>di</strong> descrivere la curva e <strong>di</strong><br />
dare la definizione <strong>di</strong> curva sotto forma <strong>di</strong> equazioni parametriche.<br />
Definizione 5.1.1 Se x e y sono entrambe funzioni <strong>di</strong> una terza variabile t (t è detto<br />
parametro), le equazioni<br />
x = f(t),<br />
y = g(t)<br />
sono dette equazioni parametriche.<br />
Ogni valore <strong>di</strong> t determina un punto (x, y): al variare <strong>di</strong> t varia il punto (x, y) che, sul piano<br />
cartesiano, descrive una curva γ, che chiamiamo curva parametrica.<br />
Il parametro t non rappresenta necessariamente il tempo e quin<strong>di</strong> si può anche utilizzare<br />
un’altra lettera per rappresentare il parametro. Poichè, in molte applicazioni, t denota il<br />
tempo, ci è più facile vedere (x, y) = (f(t), g(t)) come la posizione della particella al tempo t.<br />
Esempio<br />
Es. 5.1.1 Proviamo a fare il grafico per capire quale curva è rappresentata me<strong>di</strong>ante le<br />
equazioni parametriche<br />
{<br />
x = t 2 + t<br />
y = 2t − 1<br />
Ciascun valore <strong>di</strong> t dà un punto della curva. Perciò consideriamo <strong>di</strong>versi valori <strong>di</strong> t e i<br />
corrispondenti punti che si ottengono:<br />
t x y<br />
-2 2 -5<br />
-1 0 -3<br />
-1/2 -1/4 -2<br />
0 0 -1<br />
1 2 1<br />
In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per<br />
molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico <strong>di</strong> una curva.<br />
58
5.1. Equazioni parametriche <strong>di</strong> una curva<br />
Figura 5.2: Curva data da x = t 2 + t, y = 2t − 1<br />
Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche<br />
x = f(t), y = g(t), si muove lungo la curva nella <strong>di</strong>rezione <strong>di</strong> t crescente. Ciò significa che<br />
una curva parametrica ha una <strong>di</strong>rezione, un orientamento dato da valori crescenti<br />
<strong>di</strong> t. Sul grafico la <strong>di</strong>rezione del movimento della curva è in<strong>di</strong>cata me<strong>di</strong>ante freccette.<br />
Inoltre, osserviamo che a valori <strong>di</strong> t equi<strong>di</strong>stanti non corrispondono, sulla curva, punti<br />
equi<strong>di</strong>stanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al<br />
variare <strong>di</strong> t.<br />
Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola.<br />
In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio<br />
l’equazione <strong>di</strong> una parabola. Per far ciò, dalla seconda equazione y = 2t − 1 ricaviamo<br />
t = 1 (y + 1) e sostituiamo il valore trovato per t nell’equazione in x. Troviamo<br />
2<br />
( ) 2 1<br />
x =<br />
2 (y + 1) + 1 2 (y + 1) = 1 4 y2 + y + 3 4<br />
Riconosciamo l’equazione <strong>di</strong> una parabola.<br />
Nell’esempio, t può variare in tutto R. Se invece t deve variare in un intervallo finito,<br />
allora anche la curva risente <strong>degli</strong> effetti del parametro.<br />
Esempio<br />
Es. 5.1.2 Consideriamo le equazioni parametriche della curva precedente, ma con t ∈<br />
[−1, 1]:<br />
x = t 2 + t y = 2t − 1 − 1 ≤ t ≤ 1<br />
Abbiamo solo una porzione della curva che abbiamo <strong>di</strong>segnata prima (si veda Figura 5.3).<br />
59
5. LE CURVE<br />
Figura 5.3: Curva data da x = t 2 + t, y = 2t − 1, con −1<br />
Definizione 5.1.2 La curva <strong>di</strong> equazioni parametriche<br />
x = f(t), y = g(t), t 0 ≤ t ≤ t f<br />
ha punto iniziale (f(t 0 , g(t 0 )) e punto finale (f(t f ), g(t f )).<br />
Esempio<br />
Es. 5.1.3 Cerchiamo <strong>di</strong> capire qual è la curva rappresentata dalle equazioni<br />
parametriche x = cos t, y = sin t, con 0 ≤ t ≤ 2π.<br />
Se facciamo un grafico con le coppie <strong>di</strong> punti (x, y) al variare <strong>di</strong> t, otteniamo il grafico<br />
<strong>di</strong> una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta<br />
sfruttiamo le relazioni trigonometriche osservando che<br />
x 2 + y 2 = cos 2 t + sin 2 t = 1<br />
Quin<strong>di</strong> la circonferenza ha centro nell’origine e raggio 1.<br />
In questo esempio il parametro t può essere interpretato come l’angolo in ra<strong>di</strong>anti. Al<br />
variare <strong>di</strong> t in [0, 2π], il punto (x, y) = (cos t, sin t) si muove sulla circonferenza in <strong>di</strong>rezione<br />
antioraria partendo dal punto (1, 0) e ritornando allo stesso punto.<br />
Esempio<br />
Es. 5.1.4 Ve<strong>di</strong>amo ora la curva rappresentata dalle equazioni parametriche x = sin 4t ,<br />
y = cos 4t, con 0 ≤ t ≤ 2π.<br />
Di nuovo, da x 2 + y 2 = sin 2 4t + cos 2 4t = 1 ritroviamo l’equazione della circonferenza <strong>di</strong><br />
centro l’origine e raggio 1.<br />
Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori <strong>di</strong> t<br />
crescenti, la particella si muove in <strong>di</strong>rezione oraria lungo la circonferenza e la percorre 4<br />
volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π.<br />
60
5.2. Grafico <strong>di</strong> una curva parametrica<br />
Quin<strong>di</strong> la stessa curva può essere rappresentata in mo<strong>di</strong> <strong>di</strong>versi. Conviene perciò fare la<br />
<strong>di</strong>stinzione tra curva, come insieme <strong>di</strong> punti, da curva parametrica, come insieme <strong>di</strong> punti<br />
tracciati in modo particolare.<br />
5.2 Grafico <strong>di</strong> una curva parametrica<br />
Per fare il grafico <strong>di</strong> un’equazione della forma x = g(y) possiamo usare le equazioni<br />
parametriche<br />
x = g(t), y = t.<br />
Alla stessa maniera le curve <strong>di</strong> equazioni y = f(x) (le familiari funzioni <strong>di</strong> una variabile reale),<br />
possono essere viste come curve <strong>di</strong> equazioni parametriche<br />
x = t,<br />
y = f(t).<br />
In generale, data una curva parametrica <strong>di</strong> equazioni x = f(t), y = g(t), con t 0 ≤ t ≤ t f , per<br />
farne il grafico possiamo far variare t nell’intervallo assegnato (o per valori crescenti in R) e<br />
vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere<br />
l’orientamento della curva.<br />
A volte conviene eliminare il parametro t per capire <strong>di</strong> che curva si tratta.<br />
Altre volte la curva è talmente complicata che conviene affidarsi a programmi <strong>di</strong> grafica<br />
al calcolatore per poterla visualizzare.<br />
Esempio<br />
Es. 5.2.1 Consideriamo il caso <strong>di</strong> una curva data da<br />
x = a cos (αt) y = b cos (αt) 0 ≤ t ≤ 2π<br />
dove a, b, α sono delle costanti.<br />
Visto che le funzioni sono trigonometriche, conviene sfruttare relazioni della trigonometria<br />
per capire <strong>di</strong> che curva si tratta.<br />
Facciamo un cambio <strong>di</strong> variabile ponendo u = αt. Allora le equazioni <strong>di</strong>ventano<br />
x = a cos u y = b sin u 0 ≤ u ≤ 2απ<br />
Possiamo scrivere<br />
1 = cos 2 u + sin 2 u = x2<br />
a 2 + y2<br />
b 2<br />
trovando l’equazione <strong>di</strong> un’ellisse avente come centro l’origine (se a > b l’ellisse è orizzontale<br />
con l’asse maggiore sull’asse delle x, viceversa se a < b l’ellisse è verticale con<br />
l’asse maggiore sull’asse delle y, se invece a = b l’ellisse si riduce ad una circonferenza<br />
<strong>di</strong> raggio a).<br />
L’ellisse, per u ∈ [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol <strong>di</strong>re<br />
che la curva viene percorsa α volte dal parametro u: è come un circuito <strong>di</strong> formula 1 da<br />
ripetere per un numero α <strong>di</strong> giri.<br />
61
5. LE CURVE<br />
Figura 5.4: curva x = 4 cos (3t)<br />
y = 1 + cos 2 (3t)<br />
Esempio<br />
Es. 5.2.2 Il cammino <strong>di</strong> una particella è dato da<br />
x = 4 cos (3t)<br />
y = 1 + cos 2 (3t)<br />
Proviamo a descrivere questo cammino cercando <strong>di</strong> capire dove variano x e y e in<strong>di</strong>viduando<br />
l’intervallo in cui varia t per percorrere la curva solo una volta (nel caso in cui<br />
possa percorrerla più <strong>di</strong> una volta).<br />
Per eliminare il parametro t, sfruttiamo il fatto che le due equazioni parametriche hanno<br />
solo coseni, ricavando cos (3t) dalla prima equazione e sostituendo nella seconda:<br />
cos (3t) = x 4<br />
( x<br />
) 2 x 2<br />
y = 1 + = 1 +<br />
4 16<br />
Ricaviamo una parabola. Inoltre<br />
−1 ≤ cos (3t) ≤ 1 =⇒ −4 ≤ 4 cos (3t) ≤ 4 =⇒ −4 ≤ x ≤ 4<br />
0 ≤ cos 2 (3t) ≤ 1 =⇒ 1 ≤ 1 + cos 2 (3t) ≤ 2 =⇒ 1 ≤ y ≤ 2<br />
Proviamo ora per alcuni valori <strong>di</strong> t cosa si ricava per x e y:<br />
t x y<br />
0 4 2<br />
π/2 0 1<br />
π -4 2<br />
3π/2 0 1<br />
2π 4 2<br />
L’arco <strong>di</strong> parabola viene ripetuto più volte come un pendolo.<br />
Dagli esempi visti possiamo osservare che ci sono curve i cui punti (x, y) sono dati da un<br />
62
5.3. Parametrizzare una curva<br />
solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per <strong>di</strong>versi valori <strong>di</strong> t.<br />
Abbiamo le seguenti definizioni<br />
Definizione 5.2.1 Data una curva <strong>di</strong> equazioni parametriche x = f(t), y = g(t),<br />
G se un punto (x, y) si ottiene me<strong>di</strong>ante un solo valore del parametro t, allora il punto è detto<br />
semplice;<br />
G se un punto (x, y) si ottiene me<strong>di</strong>ante più valori del parametro t, allora il punto è detto<br />
multiplo.<br />
Definizione 5.2.2 Una curva è chiusa se è definita per t ∈ [t 0 , t f ] e (x(t 0 ), y(t 0 )) = (x(t f ), y(t f )):<br />
il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla<br />
curva che si ha per il valore finale <strong>di</strong> t.<br />
5.3 Parametrizzare una curva<br />
A volte, data una curva come equazione in x e y, vogliamo parametrizzarla.<br />
Il caso più interessante è quello <strong>di</strong> un’ellisse (e quin<strong>di</strong>, come caso particolare, un cerchio):<br />
x 2<br />
a 2 + y2<br />
b 2 = 1<br />
Come equazioni parametriche, possiamo considerare<br />
x = a cos (t) y = b sin (t) 0 ≤ t ≤ 2π<br />
In tal caso l’ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l’ellisse in senso<br />
antiorario.<br />
Una curva può essere parametrizzata in vari mo<strong>di</strong>, comunque. L’ellisse precedente, ad<br />
esempio, può essere parametrizzata come<br />
x = a cos (αt)<br />
x = a sin (αt)<br />
x = a cos (αt)<br />
y = b sin (αt)<br />
y = b cos (αt)<br />
y = −b sin (αt)<br />
La presenza della costante α ci <strong>di</strong>ce quante volte viene percorsa l’ellisse. Le ultime due<br />
equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da<br />
t = 0).<br />
5.4 Tangente ad una curva<br />
Assegnate le equazioni parametriche <strong>di</strong> una curva<br />
x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />
vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo<br />
punto.<br />
Nel caso <strong>di</strong> una funzione y = F (x), la retta tangente a F per x = a è data dall’equazione<br />
p(x) = m(x − a) + F (a), dove m = F ′ (a) = dy<br />
dx | x=a<br />
Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione <strong>di</strong> x,<br />
possiamo utilizzare la formula appena scritta per ricavare l’equazione della tangente alla<br />
63
5. LE CURVE<br />
curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro<br />
t e non <strong>di</strong> x.<br />
Supponiamo <strong>di</strong> avere (ma non abbiamo) una funzione y = F (x) che ci permetta <strong>di</strong> scrivere<br />
la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo<br />
che y = y(t) e x = x(t), quin<strong>di</strong> sostituendo abbiamo<br />
y(t) = y = F (x) = F (x(t)) =⇒ y(t) = F (x(t))<br />
Deriviamo rispetto a t:<br />
dy<br />
dt<br />
dF (x(t)) dx<br />
=<br />
dx dt<br />
A noi serve una formula per dy<br />
dF (x)<br />
ovvero per per avere la retta tangente. Dalla relazione<br />
dx dx<br />
precedente, nell’ipotesi in cui dx<br />
dt ≠ 0 ricaviamo<br />
dy dF (x(t))<br />
= =<br />
dx dx<br />
dy<br />
dt<br />
dx<br />
dt<br />
Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta<br />
come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta<br />
scambiare il ruolo della x con la y. L’equazione della retta tangente nel punto f(a) è del tipo<br />
p(y) = m(y − f(a)) + H ′ (f(a))<br />
con m = H ′ (f(a)) = dx<br />
dy | y=f(a). In maniera del tutto analoga a quanto visto prima, si ricava<br />
dx<br />
dx<br />
dy = dt<br />
dy<br />
dt<br />
per dy<br />
dt ≠ 0<br />
Esempio<br />
Es. 5.4.1 Troviamo la tangente alla curva parametrica data dalle equazioni<br />
x = t 5 − 4t 3 y = t 2<br />
nel punto (0, 4).<br />
Vedremo, in questo caso, che troveremo più <strong>di</strong> una retta tangente al punto assegnato (e<br />
ne capiremo presto il motivo).<br />
Per prima cosa applichiamo la formula data prima:<br />
dy<br />
dy<br />
dx = dt<br />
dx<br />
dt<br />
=<br />
2t<br />
5t 4 − 12t 2 = 2<br />
5t 3 − 12t<br />
64
5.4. Tangente ad una curva<br />
Figura 5.5: rette tangenti al punto (0.4) della curva x = t 5 − 4t 3 y = t 2<br />
Attenzione, adesso, perchè la derivata è in termini <strong>di</strong> t ma noi dobbiamo calcolare la<br />
tangente in un punto assegnato in<strong>di</strong>viduato dalle coor<strong>di</strong>nate (x, y) = (0, 4). Dobbiamo<br />
quin<strong>di</strong> determinare per quale/i valore/i <strong>di</strong> t si ottiene questo punto.<br />
Per la curva e il punto dati, deve quin<strong>di</strong> valere<br />
{<br />
x = t 5 − 4t 3 = 0<br />
y = t 2 = 4<br />
=⇒<br />
{<br />
t 3 (t 2 − 4) = 0 → t = 0, t = ±2<br />
t 2 = 4 → t = ±2<br />
Le soluzioni accettabili per le due equazioni sono t = ±2.<br />
Per t = −2 la pendenza della retta tangente risulta<br />
m = dy<br />
dx | t=−2 = − 1 8<br />
e quin<strong>di</strong> la retta tangente è<br />
y = 4 − 1 8 x<br />
Per t = 2 invece si ha<br />
m = dy<br />
dx | t=2 = 1 8<br />
e la retta tangente è<br />
y = 4 + 1 8 x<br />
Perchè due rette tangenti nel punto (0, 4) Perchè la curva ”gira“ attorno al punto (0, 4)<br />
e quin<strong>di</strong> abbiamo due rette tangenti (si veda Figura 5.5).<br />
65
5. LE CURVE<br />
Possiamo avere anche tangenti orizzontali o verticali, in un determinato punto <strong>di</strong> una<br />
curva, a seconda che la derivata <strong>di</strong> y o x rispetto a t sia nulla:<br />
G si ha una tangente orizzontale quando dy<br />
dt = 0 e dx<br />
dt ≠ 0<br />
G si ha una tangente verticale quando dx<br />
dt = 0 e dy<br />
dt ≠ 0.<br />
Possiamo anche scrivere le equazioni della retta tangente ad una curva parametrica in<br />
forma parametrica. Dato il punto P 0 = (x 0 , y 0 ) = (x(t 0 ), y(t 0 ), i valori delle derivate dx(t 0)<br />
,<br />
dt<br />
dy(t 0 )<br />
rappresentano i valori delle tangenti alla curva, componente per componente. L’equazione<br />
della retta tangente a P 0 , scritta in forma parametrica, deve passare per P 0 e<br />
dt<br />
avere come <strong>di</strong>rezione quella data dal vettore ⃗v che ha come componenti le due derivate<br />
⃗v = ( dx(t 0)<br />
, dy(t 0)<br />
). Scritta in forma vettoriale, la retta tangente deve essere della forma<br />
dt dt<br />
⃗r t = P 0 + t⃗v<br />
dove P 0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della<br />
retta, ⃗v è il vettore che dà la <strong>di</strong>rezione della retta. In forma parametrica abbiamo<br />
⃗r t = (x 0 + t dx(t 0)<br />
dt<br />
, y 0 + t dy(t 0)<br />
)<br />
dt<br />
Osserviamo che, dalle equazioni della tangente x = x 0 + t dx(t 0)<br />
, y = y 0 t dy(t 0)<br />
, se dalla<br />
dt<br />
dt<br />
prima equazione ricaviamo t in funzione <strong>di</strong> x e sostituiamo nella seconda equazione, troviamo<br />
l’equazione della retta tangente che abbiamo ricavato prima.<br />
5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione<br />
Prima <strong>di</strong> capire come si calcola la lunghezza <strong>di</strong> una curva parametrica, partiamo dal voler<br />
calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> funzione: data una funzione continua y = f(x) vogliamo<br />
determinare la lunghezza dell’arco della curva data dalla funzione nell’intervallo [a, b].<br />
Per prima cosa, <strong>di</strong>amo una stima approssimata della lunghezza <strong>di</strong> questa curva: <strong>di</strong>vi<strong>di</strong>amo<br />
l’intervallo [a, b] in n parti uguali <strong>di</strong> ampiezza ∆x ottenendo sulla curva n + 1 punti<br />
P i , i = 0, 1, 2, . . . , n. Possiamo quin<strong>di</strong> approssimare la curva me<strong>di</strong>ante una serie <strong>di</strong> segmenti<br />
congiungenti questi punti. Ve<strong>di</strong>amo in figura 5.6 un esempio con n = 9. Poichè la lunghezza<br />
<strong>di</strong> ciascuno dei segmenti congiungenti P i−1 e P i altro non è che la <strong>di</strong>stanza euclidea tra i due<br />
punti |P i − P i−1 |, la curva sarà dunque approssimata da<br />
L ≈<br />
n∑<br />
|P i−1 − P i |<br />
i=1<br />
Prendendo valori <strong>di</strong> n sempre più gran<strong>di</strong> noi avremo valori via via più accurati. Passando al<br />
limite per n → ∞ avremo la lunghezza dell’arco <strong>di</strong> curva:<br />
L = lim<br />
n→∞<br />
i=1<br />
n∑<br />
|P i−1 − P i |<br />
Ora, ciascuno punto P i ha coor<strong>di</strong>nate del tipo (x i , f(x i )), da cui<br />
|P i−1 − P i | = √ (x i − x i−1 ) 2 + (f(x i ) − f(x i−1 )) 2<br />
Dal teorema del valor me<strong>di</strong>o sappiamo che f(x i ) − f(x i−1 ) = f ′ (ξ i )(x i − x i−1 ) dove ξ i è un<br />
punto che non conosciamo all’interno dell’intervallo [x i−1 , x i ]. Ricordando che abbiamo <strong>di</strong>viso<br />
66
5.6. Lunghezza <strong>di</strong> una curva<br />
Figura 5.6: Approssimazione della lunghezza <strong>di</strong> un arco <strong>di</strong> funzione me<strong>di</strong>ante segmenti <strong>di</strong><br />
retta<br />
l’intervallo [a, b] <strong>di</strong> partenza in n parti uguali, si ha x i − x i−1 = ∆x da cui, f(x i ) − f(x i−1 ) =<br />
f ′ (ξ i )∆x da cui la lunghezza del segmento si può anche scrivere come<br />
|P i−1 − P i | = √ ∆x 2 + (f ′ (ξ i )∆x) 2 = √ (1 + f ′ (ξ i ) 2 )∆x 2 = √ (1 + f ′ (ξ i ) 2 )∆x<br />
Inserendo questa formula nel limite che fornisce la lunghezza dell’arco <strong>di</strong> curva si ha<br />
L = lim<br />
n→∞<br />
i=1<br />
n∑ √<br />
1 + f<br />
′<br />
(ξ i ) 2 ∆x<br />
Usando la definizione dell’integrale definito, questo limite non è nient’altro che un<br />
integrale e, precisamente,<br />
L =<br />
∫ b<br />
a<br />
√<br />
1 + f<br />
′<br />
(x) 2 dx<br />
In maniera equivalente, poichè y = f(x) possiamo riscrivere<br />
√<br />
∫ b<br />
( ) 2 dy<br />
L = 1 + dx<br />
dx<br />
a<br />
Se, invece, abbiamo una funzione scritta in funzione <strong>di</strong> y, vale a <strong>di</strong>re x = h(y) con c ≤ y ≤ d,<br />
la stessa formula <strong>di</strong>venta:<br />
√<br />
∫ d<br />
( ) 2 dx<br />
L = 1 + dy<br />
dy<br />
c<br />
5.6 Lunghezza <strong>di</strong> una curva<br />
Così come abbiamo trovato una formula per calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> una<br />
funzione y = f(x) o x = h(y), in maniera del tutto analoga, possiamo misurare la lunghezza<br />
<strong>di</strong> una curva.<br />
Sia data una curva in forma parametrica come<br />
x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />
67
5. LE CURVE<br />
Assumiamo che dx ≥ 0: ciò significa che la curva è attraversata solo una volta, da sinistra<br />
dt<br />
verso destra, per t che aumenta nell’intervallo [t 0 , t f ]. La curva, quin<strong>di</strong>, è semplice.<br />
Supponiamo, come per la tangente, <strong>di</strong> poter scrivere y = F (x) o x = H(y) anche se, in<br />
realtà, x = x(t) e y = y(t). Applicando le formule viste per l’arco <strong>di</strong> una funzione alla curva<br />
scritta non in forma parametrica noi dobbiamo applicare una delle due formule:<br />
L =<br />
L =<br />
∫ b<br />
a<br />
∫ d<br />
c<br />
√<br />
√<br />
1 +<br />
1 +<br />
( ) 2 dy<br />
dx se y = f(x), a ≤ x ≤ b<br />
dx<br />
( ) 2 dx<br />
dy se x = h(y), c ≤ y ≤ d<br />
dy<br />
Se lavoriamo considerando y = F (x), poichè x = x(t), operiamo un cambio <strong>di</strong> variabile<br />
per calcolare l’integrale: si ha dx = dx(t) dt (o equivalentemente, se consideriamo x = H(y),<br />
dt<br />
dy = dy<br />
dy dx<br />
dt), mentre per le derivate (o ) ci riconduciamo alle formule viste per la tangente.<br />
dt dx dy<br />
Quin<strong>di</strong> la formula per trovare la lunghezza dell’arco <strong>di</strong> una curva o, più semplicemente, la<br />
lunghezza <strong>di</strong> una curva, <strong>di</strong>venta:<br />
L =<br />
∫ tf<br />
⎛<br />
√ √√√√√<br />
⎜<br />
1 + ⎝<br />
t 0<br />
dy<br />
dt<br />
dx<br />
dt<br />
⎞<br />
2<br />
⎟<br />
⎠<br />
dx<br />
dt dt = ∫ tf<br />
√ √√√√√√√ ( dy<br />
dt<br />
1 + (<br />
t 0 dx<br />
dt<br />
) 2<br />
) 2<br />
dx<br />
dt dt<br />
Semplificando l’espressione sotto ra<strong>di</strong>ce otteniamo<br />
√<br />
∫ tf (dx ) 2 ( ) 2<br />
1<br />
dy dx<br />
L =<br />
t 0 dx<br />
+<br />
dt dt dt dt<br />
∣ dt ∣<br />
Nell’ipotesi fatta per cui dx è positiva possiamo semplificare ancora ottenendo<br />
dt<br />
√<br />
∫ tf (dx ) 2 ( ) 2 dy<br />
L =<br />
+ dt<br />
dt dt<br />
t 0<br />
Osserviamo che, nel caso in cui è dy ≥ 0, usando la formula per x in funzione <strong>di</strong> y, si<br />
dt<br />
ottiene<br />
L =<br />
∫ tf<br />
⎛<br />
√ √√√√√<br />
⎜<br />
1 + ⎝<br />
t 0<br />
dx<br />
dt<br />
dy<br />
dt<br />
⎞<br />
2<br />
⎟<br />
⎠<br />
dy<br />
dt dt<br />
da cui si arriva alla stessa formula.<br />
Se invece non rappresentiamo la curva me<strong>di</strong>ante la forma y = F (x) o x = H(y), arriviamo<br />
allo stesso risultato utilizzando un’approssimazione poligonale. Divi<strong>di</strong>amo l’intervall [t 0 , t f ] in<br />
n sottointervalli <strong>di</strong> stessa ampiezza ∆t. Chiamiamo t 0 , t 1 , t 2 , . . . , t n = t f i punti finali <strong>di</strong> questi<br />
68
5.6. Lunghezza <strong>di</strong> una curva<br />
sottointervalli e in<strong>di</strong>chiamo con (x i , y i ) i punti che si ottengono sulla curva con il parametro<br />
t i . Quin<strong>di</strong> x i = x(t i ) e y i = y(t i ). In<strong>di</strong>chiamo con P i i punti sul piano cartesiano che hanno<br />
coor<strong>di</strong>nate date da (x i , y i ).<br />
I punti P i si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da<br />
P i , che approssima la curva γ. Con lo stesso <strong>di</strong>scorso fatto per trovare la lunghezza <strong>di</strong> un<br />
arco <strong>di</strong> funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti<br />
P i−1 P i = |P i−1 − P i |<br />
Ora<br />
L ≈<br />
n∑<br />
|P i−1 − P i |<br />
i=1<br />
|P i−1 − P i | = √ (x i − x i−1 ) 2 + (y i − y i−1 ) 2 = √ (x(t i ) − x(t i−1 )) 2 + (yt i ) − y(t i−1 )) 2<br />
Applichiamo il teorema del Valor Me<strong>di</strong>o alla funzione x(t) nell’intervallo [t i−1 , t i ]:<br />
x(t i ) − x(t i−1 ) = x ′ (t ∗ i )∆t<br />
dove t ∗ i è un punto opportuno che si trova all’interno dell’intervallo [t i−1, t i ]. Analogamente,<br />
applicando lo stesso teorema alla funzione y(t) si ha<br />
y(t i ) − y(t i−1 ) = y ′ (t ∗∗<br />
i )∆t<br />
con t ∗∗<br />
i punto opportuno che si trova all’interno dell’intervallo [t i−1 , t i ]. Di conseguenza<br />
√<br />
√<br />
|P i−1 − P i | = [x ′ (t ∗ i )∆t]2 + [y ′ (t ∗∗<br />
i )∆t] 2 = [x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />
i )] 2 ∆t<br />
Sostituendo nell’espressione data per L e passando al limite per n → +∞ si ha<br />
L =<br />
lim<br />
n→+∞<br />
i=1<br />
n∑<br />
|P i−1 − P i | = lim<br />
n∑ √<br />
n→+∞<br />
i=1<br />
[x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />
i<br />
)] 2 ∆t<br />
Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell’arco <strong>di</strong><br />
una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t ∗ i e t ∗∗<br />
i<br />
che sono <strong>di</strong>versi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite<br />
scritto prima è lo stesso che si avrebbe con i due punti t ∗ i e t ∗∗<br />
i coincidenti. Quin<strong>di</strong> si può<br />
passare all’integrale<br />
L =<br />
∫ tf<br />
t 0<br />
√<br />
[x ′ (t)] 2 + [y ′ (t)] 2 dt<br />
Se, al posto <strong>di</strong> x ′ (t) scriviamo dx<br />
dt e, al posto <strong>di</strong> y′ (t) scriviamo dy<br />
dt<br />
prima per la lunghezza <strong>di</strong> una curva.<br />
Riassumiamo questo risultato nel teorema.<br />
otteniamo la formula vista<br />
Teorema 5.6.1 Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t),<br />
con t 0 ≤ t ≤ t f , e x ′ (t) e y ′ (t) sono funzioni continue e γ è una curva semplice (percorsa solo<br />
una volta per t crescente da t 0 a t f ), allora la lunghezza della curva è data da:<br />
L =<br />
∫ tf<br />
t 0<br />
√ (dx ) 2<br />
+<br />
dt<br />
( ) 2 dy<br />
dt<br />
dt<br />
69
5. LE CURVE<br />
Figura 5.7: cicloide<br />
Esempio<br />
Es. 5.6.1 Vogliamo determinare la lunghezza della curva<br />
x = 3 sin (t) y = 3 cos (t) 0 ≤ t ≤ 2π<br />
Riconosciamo un cerchio <strong>di</strong> centro l’origine e raggio 3.<br />
Per applicare la formula ci serve calcolare dx<br />
dt e dy<br />
dt :<br />
dx<br />
dt<br />
= 3 cos (t)<br />
dy<br />
dt<br />
= −3 sin (t)<br />
Dobbiamo quin<strong>di</strong> calcolare l’integrale<br />
L =<br />
= 3<br />
∫ 2π<br />
0<br />
∫ 2π<br />
0<br />
√<br />
9 cos 2 (t) + 9 sin 2 (t)dt =<br />
∫ 2π<br />
√<br />
∫ 2π<br />
1dt = 3 dt = 3 · 2π = 6π<br />
0<br />
0<br />
√<br />
3 cos 2 (t) + sin 2 (t)dt =<br />
La lunghezza della curva è esattamente la lunghezza della circonferenza! In questo caso<br />
abbiamo una verifica imme<strong>di</strong>ata del risultato che abbiamo ottenuto.<br />
5.7 La curva cicloide<br />
La curva tracciata da un punto P sulla circonferenza <strong>di</strong> un cerchio quando il cerchio<br />
rotola su una linea retta è detta cicloide (si veda Figura 5.7). Per rappresentare questa curva<br />
scegliamo come parametro l’angolo <strong>di</strong> rotazione θ con cui si muove il cerchio. Per θ = 0 il<br />
punto P si trova all’origine <strong>degli</strong> assi cartesiani. Se il cerchio rotola <strong>di</strong> un angolo θ, poichè la<br />
circonferenza rimane sempre in contatto con la linea retta data dall’asse delle x, la <strong>di</strong>stanza<br />
del punto <strong>di</strong> contatto tra circonferenza e asse delle x (punto che chiamiamo T ) dall’origine<br />
coincide con la lunghezza dell’arco P T dove P è il punto che osserviamo quando il cerchio<br />
rotola (si veda la Figura 5.8):<br />
OT = arc(P T )<br />
L’angolo <strong>di</strong> rotazione θ è sotteso all’arco <strong>di</strong> estremi P e T . Poichè la lunghezza <strong>di</strong><br />
un arco è proporzionale all’ampiezza dell’angolo, considerando che all’angolo centrale 2π<br />
corrispondenza la lunghezza della circonferenza 2πr, possiamo scrivere<br />
θ<br />
2π = arc(P T )<br />
2πr<br />
Da questa relazione otteniamo arc(P T ) = rθ, da cui OT = rθ.<br />
70
5.8. Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />
Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio<br />
rotola lungo l’asse x.<br />
Figura 5.9: Rappresentazione grafica della curva cicloide per r = 2 e 0 ≤ θ ≤ 2π (a sinistra) e<br />
0 ≤ θ ≤ 8π (a destra).<br />
Questo risultato ci serve per trovare le coor<strong>di</strong>nate del punto P . Si ha infatti (aiutandoci<br />
con la Figura 5.8):<br />
x = OT − P Q<br />
y = CT − CQ<br />
Considerando il triangolo rettangolo <strong>di</strong> vertici P , Q e il centro della circonferenza C, il lato<br />
CP = r mentre i lati P Q e CQ sono dati dalle formule trigonometriche<br />
P Q = CP sin θ = r sin θ,<br />
CQ = CP cos θ = r cos θ<br />
. Il lato CT vale r. Inserendo queste relazioni nelle espressioni precedenti troviamo<br />
x = OT − P Q = rθ − r sin θ = r(θ − sin θ)<br />
y = CT − CQ = r − r cos θ = r(1 − cos θ)<br />
Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da<br />
x = r(θ − sin θ), y = r(1 − cos θ)<br />
Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2,<br />
esse sono valide anche per altri valori <strong>di</strong> θ. Un arco completo della curva cicloide è dato dalla<br />
rotazione completa della circonferenza e si ha, quin<strong>di</strong>, per θ ∈ [0, 2π].<br />
5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />
Siamo abituati a rappresentare un punto nel piano utilizzando le coor<strong>di</strong>nate cartesiane.<br />
Vi è tuttavia un altro sistema <strong>di</strong> coor<strong>di</strong>nate (introdotto da Newton) che può essere conve-<br />
71
5. LE CURVE<br />
Figura 5.10: Coor<strong>di</strong>nate polari.<br />
Figura 5.11: Passaggio da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane.<br />
niente per molti scopi, tra cui quello <strong>di</strong> rappresentare alcune curve parametriche. Questo<br />
sistema prende il nome <strong>di</strong> sistema <strong>di</strong> coor<strong>di</strong>nate polari.<br />
Scegliamo un punto nel piano che chiamiamo polo o origine (lo in<strong>di</strong>chiamo con O). Dall’origine<br />
tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato<br />
orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell’asse delle x<br />
del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il segmento,<br />
<strong>di</strong> lunghezza r, che unisce P all’origine e consideriamo l’angolo θ (<strong>di</strong> solito espresso<br />
in ra<strong>di</strong>anti) tra l’asse polare e il segmento OP . Il punto P viene rappresentato dalla coppia<br />
or<strong>di</strong>nata (r, θ) e r, θ sono le coor<strong>di</strong>nate polari del punto P (si veda Figura 5.10). Si usa la<br />
convenzione che un angolo è positivo se misurato in senso antiorario rispetto all’asse polare.<br />
Inoltre il punto (0, θ) rappresenta l’origine, qualunque sia θ.<br />
Si estende il sistema <strong>di</strong> coor<strong>di</strong>nate polari a valori <strong>di</strong> r negativi, con la convenzione che il<br />
punto del tipo (−r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa <strong>di</strong>stanza |r| da O,<br />
ma sul lato opposto rispetto a (r, θ). Dire (−r, θ) è la stessa cosa <strong>di</strong> (r, θ + π). Come conseguenza,<br />
un punto nel sistema <strong>di</strong> coor<strong>di</strong>nate polari può avere più <strong>di</strong> una rappresentazione.<br />
Dal momento che una completa rotazione antioraria è data dall’angolo 2π, si ha che il punto<br />
(r, θ) può essere rappresentato anche come (r, θ + 2nπ), e (−r, θ + (2n + 1)π) con n intero.<br />
Per passare dalla rappresentazione in coor<strong>di</strong>nate polari al sistema <strong>di</strong> coor<strong>di</strong>nate cartesiane,<br />
basta osservare che l’origine del sistema polare corrisponde all’origine del sistema cartesiano,<br />
l’asse polare corrisponde all’asse delle x e, <strong>di</strong> conseguenza, il punto P <strong>di</strong> coor<strong>di</strong>nate<br />
polari (r, θ), ha coor<strong>di</strong>nate cartesiane x e y date da<br />
x = r cos θ,<br />
y = r sin θ<br />
(si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati <strong>di</strong><br />
un triangolo rettangolo all’angolo compreso tra ipotenusa e uno dei due cateti). Viceversa,<br />
dato un punto P in coor<strong>di</strong>nate cartesiane, per trovare i valori <strong>di</strong> r e θ delle corrispondenti<br />
72
5.9. Curve in coor<strong>di</strong>nate polari<br />
Figura 5.12: Punto (1, −1) in coor<strong>di</strong>nate polari e cartesiane.<br />
coor<strong>di</strong>nate polari, possiamo sfruttare le relazioni<br />
r 2 = x 2 + y 2 , e tan θ = y x<br />
che ricaviamo dalle relazioni precedenti. Poichè tan θ = tan (θ + π), dobbiamo prestare attenzione<br />
a scegliere il valore <strong>di</strong> θ che permette <strong>di</strong> avere, nel piano polare, lo stesso punto del<br />
piano cartesiano.<br />
Esempio<br />
Es. 5.8.1 Convertiamo il punto (2, π/4) da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane. Da<br />
x = r cos θ e y = r sin θ, sostituendo i valori <strong>di</strong> r e θ otteniamo x = 2 cos (π/4) = 2 √<br />
2<br />
= √ 2 e<br />
y = 2 sin (π/4) = 2 √<br />
2<br />
= √ 2. In coor<strong>di</strong>nate cartesiane abbiamo il punto ( √ 2, √ 2).<br />
Esempio<br />
Es. 5.8.2 Rappresentiamo in coor<strong>di</strong>nate polari il punto dato in coor<strong>di</strong>nate cartesiane<br />
(1, −1).<br />
Scegliamo la rappresentazione con r > 0 andando a considerare la ra<strong>di</strong>ce positiva <strong>di</strong><br />
x 2 + y 2 . Quin<strong>di</strong> r = √ 1 + 1 = √ 2.<br />
Abbiamo da risolvere l’equazione tan θ = y x = −1.<br />
Sia θ = 3π 4 + 2nπ sia θ = −π + 2nπ con n intero (n = 0, 1, . . .) hanno come tangente il<br />
4<br />
valore −1. Scegliamo il valore <strong>di</strong> θ che ci permette (insieme a r = √ 2) <strong>di</strong> avere il punto<br />
P posizionato nel corretto quadrante: dobbiamo scegliere θ = − π 4 + 2nπ. Pren<strong>di</strong>amo<br />
θ = − π 4 . Il punto in coor<strong>di</strong>nate polari dato da (√ 2, − π ) corrisponde a (1, −1) in coor<strong>di</strong>nate<br />
4<br />
cartesiane. Se considerassimo il punto ( √ 2, 3π 4<br />
(si veda Figura 5.12 per un confronto).<br />
) avremmo, in coor<strong>di</strong>nate cartesiane (−1, 1)<br />
5.9 Curve in coor<strong>di</strong>nate polari<br />
Un’equazione polare del tipo r = f(θ) o, più in generale, F (r, θ) = 0 ha come grafico<br />
l’insieme <strong>di</strong> tutti i punti P <strong>di</strong> coor<strong>di</strong>nate polari (r, θ), che sod<strong>di</strong>sfano l’equazione. Possiamo<br />
dunque avere delle curve rappresentate me<strong>di</strong>ante coor<strong>di</strong>nate polari.<br />
73
5. LE CURVE<br />
Esempio<br />
Es. 5.9.1 La curva <strong>di</strong> equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal<br />
momento che r rappresenta la <strong>di</strong>stanza dei punti dal polo (l’origine del piano polare), la<br />
curva data rappresenta il cerchio <strong>di</strong> centro il polo O e raggio 4.<br />
Esempio<br />
Es. 5.9.2 La curva polare θ = π/5 consiste <strong>di</strong> tutti i punti (r, θ) con θ = π/5 ra<strong>di</strong>anti.<br />
Abbiamo quin<strong>di</strong> una retta che passa per O e che forma un angolo <strong>di</strong> π/5 ra<strong>di</strong>anti con<br />
l’asse polare.<br />
Esempio<br />
Es. 5.9.3 Troviamo le equazioni cartesiane della curva polare r = 2 cos θ.<br />
Se proviamo a fare il grafico della curva sul piano polare, al variare <strong>di</strong> θ, ci accorgiamo<br />
che il grafico rappresenta una circonferenza.<br />
Per passare a coor<strong>di</strong>nate cartesiane, da x = r cos θ abbiamo cos θ = x/r quin<strong>di</strong> r = 2 cos θ =<br />
2x/r, cioè r 2 = 2x ma r 2 = x 2 +y 2 , da cui x 2 +y 2 = 2x o ancora x 2 +y 2 −2x = 0. Aggiungendo<br />
e sottraendo 1 abbiamo<br />
x 2 + y 2 − 2x + 1 − 1 = 0 cioè (x − 1) 2 + y 2 = 1<br />
Abbiamo l’equazione della circonferenza <strong>di</strong> centro (1, 0) e raggio 1.<br />
5.9.1 La curva car<strong>di</strong>oide<br />
Stu<strong>di</strong>amo ora la curva car<strong>di</strong>oide, chiamata in questo modo perchè a forma <strong>di</strong> cuore, data<br />
dall’equazione r = 1 + sin θ.<br />
Per farne il grafico, facciamo prima <strong>di</strong> tutto il grafico, in coor<strong>di</strong>nate cartesiane, della<br />
funzione r = 1 + sin θ (si veda Figura 5.13, a sinistra), che altro non è che la funzione sin a<br />
cui è aggiunta un’unità. Per θ che varia da 0 a π/2, r cresce da 1 a 2. Ma r rappresenta<br />
la <strong>di</strong>stanza dal polo in coor<strong>di</strong>nate polari, perció nel grafico in coor<strong>di</strong>nate polari dobbiamo<br />
far variare r da 1 a 2 (in<strong>di</strong>chiamo con ➀ questa porzione <strong>di</strong> curva). Per θ che varia da π/2<br />
a π, r decresce da 2 a 1 perciò nella corrispondente curva polare dobbiamo rappresentare<br />
questa decrescita (in<strong>di</strong>cata nella regione ➁). Per θ ∈ [π, 3π/2] r decresce da 1 a 0 e si ha la<br />
corrispondente portione ➂ della curva polare. Infine, per θ ∈ [3π/2, 2π] r aumenta da 0 a 1,<br />
come mostrato nella porzione ➃.<br />
Se θ dovesse andare oltre 2π, la curva ripercorrebbe lo stesso percorso.<br />
5.10 Lunghezza <strong>di</strong> una curva polare<br />
Se vogliamo calcolare la lunghezza <strong>di</strong> una curva in coor<strong>di</strong>nate polari, la formula che<br />
abbiamo dato per la lunghezza <strong>di</strong> una curva parametrica si semplifica. Infatti, se passiamo a<br />
coor<strong>di</strong>nate cartesiane, le equazioni che caratterizzano la curva polare r = f(θ) con θ 0 ≤ θ ≤ θ f<br />
sono date da<br />
x = r cos θ = f(θ) cos θ,<br />
y = r sin θ = f(θ) sin θ<br />
Quin<strong>di</strong> x e y sono funzioni <strong>di</strong> θ. Assumendo che f ′ sia una funzione continua, la lunghezza<br />
della curva è data dalla formula<br />
√<br />
∫ θf (dx ) 2 ( ) 2 dy<br />
L =<br />
+ dθ<br />
dθ dθ<br />
74<br />
θ 0
5.10. Lunghezza <strong>di</strong> una curva polare<br />
Figura 5.13: Car<strong>di</strong>oide.<br />
Si ha (considerando che x e y sono date dal prodotto <strong>di</strong> due funzioni):<br />
dx<br />
dθ = f ′ (θ) cos θ − f(θ) sin θ = dr cos θ − r sin θ<br />
dθ<br />
dy<br />
dθ = f ′ (θ) sin θ + f(θ) cos θ = dr sin θ + r cos θ<br />
dθ<br />
Sfruttando il fatto che cos 2 θ + sin 2 θ = 1 si ha<br />
( ) 2 ( ) 2 ( ) 2 dx dy dr<br />
+ = cos 2 θ + r 2 sin 2 θ − 2r dr cos θ sin θ+<br />
dθ dθ dθ<br />
dθ<br />
( ) 2 dr<br />
+ sin 2 θ + r 2 cos 2 θ + 2r dr cos θ sin θ<br />
dθ<br />
dθ<br />
( ) 2 dr<br />
= (cos 2 θ + sin 2 θ) + r 2 (cos 2 θ + sin 2 θ)+<br />
dθ<br />
− 2r dr<br />
dr<br />
cos θ sin θ + 2r cos θ sin θ<br />
dθ dθ<br />
( ) 2 dr<br />
= + r 2<br />
dθ<br />
Andando a sostituire nell’integrale che dà la lunghezza della curva si ha<br />
√<br />
∫ θf<br />
( ) 2 dr<br />
L = r 2 + dθ<br />
dθ<br />
θ 0<br />
Abbiamo trovato una formula semplificata per la lunghezza della curva polare.<br />
5.10.1 Lunghezze <strong>di</strong> alcune curve<br />
La curva car<strong>di</strong>oide<br />
Calcoliamo la lunghezza della curva car<strong>di</strong>oide r = 1 + sin θ con θ ∈ [0, 2π].<br />
Poichè dr = cos θ la lunghezza della curva è data dall’integrale<br />
dθ<br />
∫ 2π √<br />
∫ 2π √<br />
L = (1 + sin θ)2 + cos 2 θdθ = 1 + sin 2 θ + 2 sin θ + cos 2 θdθ<br />
=<br />
0<br />
∫ 2π<br />
0<br />
0<br />
∫<br />
√ 2π √ √<br />
2 + 2 sin θdθ = 2 1 + sin θdθ<br />
0<br />
75
5. LE CURVE<br />
Per calcolare questo integrale moltiplichiamo e <strong>di</strong>vi<strong>di</strong>amo per √ 1 − sin θ ricavando<br />
L = √ 2<br />
= √ 2<br />
∫ 2π<br />
0<br />
∫ 2π<br />
0<br />
√<br />
√ 1 − sin θ<br />
1 + sin θ √ dθ = √ ∫ 2π<br />
2<br />
1 − sin θ 0<br />
√<br />
cos2 θ<br />
√ dθ = √ ∫ 2π<br />
| cos θ|<br />
2 √ dθ<br />
1 − sin θ 0 1 − sin θ<br />
√<br />
1 − sin 2 θ<br />
√<br />
1 − sin θ<br />
dθ<br />
Abbiamo un integrale che <strong>di</strong>pende dal valore assoluto <strong>di</strong> cos θ: poichè cos θ è positivo per<br />
0 ≤ θ ≤ π/2 e per 3π/2 ≤ θ ≤ 2π, mentre è negativo per π/2 ≤ θ ≤ 3π/2, l’integrale si spezza nei<br />
tre integrali<br />
L = √ ∫ 2π<br />
| cos θ|<br />
2 √ dθ =<br />
1 − sin θ<br />
= √ 2<br />
0<br />
∫ π/2<br />
Osserviamo che<br />
∫<br />
cos θ<br />
√ dθ 1 − sin θ<br />
0<br />
cos θ<br />
√ dθ − √ ∫ 3π/2<br />
2<br />
1 − sin θ π/2<br />
cos θ<br />
√ dθ + √ ∫ 2π<br />
2<br />
1 − sin θ 3π/2<br />
cos θ<br />
√<br />
1 − sin θ<br />
dθ<br />
si può risolvere facendo il cambiamento <strong>di</strong> variabile u = sin θ da cui du = cos θdθ ricavando<br />
∫<br />
∫<br />
∫<br />
1<br />
−1<br />
D(1 − u)<br />
√ du = − √ du = − √ du = −2 √ 1 − u + costante<br />
1 − u 1 − u 1 − u<br />
Abbiamo considerato che la derivata <strong>di</strong> 1 − u vale −1 (l’abbiamo in<strong>di</strong>cata con D(1 − u) e che<br />
∫<br />
x n dx = xn+1<br />
n + 1 + costante.<br />
Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo<br />
L = √ [ ∣∣∣−2 √ ∣ ∣∣<br />
θ=π/2<br />
∣<br />
2 1 − sin θ − ∣−2 √ 1 − sin θ∣ θ=3π/2<br />
∣<br />
+ ∣−2 √ ]<br />
1 − sin θ∣ θ=2π<br />
θ=0<br />
θ=π/2<br />
θ=3π/2<br />
= √ 2 [( −2 √ 1 − 1 + 2 √ 1 − 0 ) − ( −2 √ 1 + 1 + 2 √ 1 − 1 ) + ( −2 √ 1 − 0 + 2 √ 1 + 1 )]<br />
= √ (<br />
2 2 + 2 √ 2 − 2 + 2 √ )<br />
2<br />
= √ (<br />
2 4 √ )<br />
2 = 8<br />
La lunghezza della curva car<strong>di</strong>oide vale 8.<br />
La spirale <strong>di</strong> Archimede<br />
La spirale <strong>di</strong> Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro<br />
assegnato, positivo e θ che varia nell’intervallo [0, θ f ] (si veda figura 5.14 per vedere cosa<br />
succede aumentando θ f ).<br />
Per calcolare la lunghezza <strong>di</strong> questa curva, poichè dρ = k si ha<br />
dθ<br />
L =<br />
∫ θf<br />
0<br />
√<br />
∫ θf √<br />
k2 + (kθ) 2 dθ = k 1 + θ2 dθ<br />
L’integrale da risolvere non è imme<strong>di</strong>ato nè semplice.<br />
0<br />
76
5.10. Lunghezza <strong>di</strong> una curva polare<br />
Figura 5.14: Spirale <strong>di</strong> Archimede con k = 2 e θ f = 2π (a sinistra) e θ f = 10π (a destra)<br />
Per capire come si arriva al risultato, ve<strong>di</strong>amo nei dettagli la sua risoluzione (specie perchè<br />
si tratta <strong>di</strong> un integrale che può capitare <strong>di</strong> incontrare anche in altre occasioni). 1<br />
Calcoliamo quin<strong>di</strong> l’integrale ∫ √ 1 + x 2 dx (per semplicità consideriamo l’integrale<br />
indefinito e usiamo x al posto <strong>di</strong> θ).<br />
Facciamo un cambiamento <strong>di</strong> variabile ponendo x = tan u. Sappiamo che D(tan u) =<br />
1<br />
cos 2 u . La funzione 1<br />
viene chiamiata anche secante (trigonometrica) e in<strong>di</strong>cata con il<br />
cos u<br />
simbolo sec u (sec u = 1 ). Per semplicità useremo anche noi questa terminologia.<br />
cos u<br />
Consideriamo, inoltre, queste relazioni che useremo nel seguito:<br />
G 1 + tan 2 u = 1 + sin2 u<br />
cos 2 u = cos2 u + sin 2 u<br />
cos 2 = 1<br />
u cos 2 u = sec2 u<br />
1<br />
G D(sec u) = D(<br />
cos u ) = sin u<br />
cos 2 u = tan u = tan u sec u<br />
cos u<br />
1<br />
Tornando all’integrale, da x = tan u si ha dx = D(tan u)du =<br />
cos 2 u du = sec2 udu.<br />
Sostituendo si ha<br />
I =<br />
∫ √1<br />
+ x2 dx =<br />
∫ √<br />
1 + tan 2 u sec 2 udu<br />
Per la relazione 1 + tan 2 u = sec 2 u si ha<br />
I =<br />
∫ √sec2<br />
u sec 2 udu<br />
Poichè u = arctan x, si ha −π/2 ≤ u ≤ π/2 e in questo intervallo cos u ≥ 0 da cui sec u ≥ 0,<br />
quin<strong>di</strong> √ sec u = sec u. Allora<br />
∫ √sec2<br />
∫<br />
I = u sec 2 udu = sec 3 udu<br />
L’integrale in sec 3 u si risolve riconducendosi all’integrale <strong>di</strong> sec u. Risolviamo prima quest’ultimo<br />
integrale (usando <strong>degli</strong> accorgimenti: come vedete, la strada per risolvere l’integrale<br />
<strong>di</strong> partenza è molto lunga).<br />
∫<br />
∫<br />
sec udu =<br />
=<br />
sec u + tan u<br />
sec u<br />
sec u + tan u du<br />
∫ sec 2 u + sec u tan u<br />
du<br />
sec u + tan u<br />
1 Se ci dovesse capitare <strong>di</strong> risolvere un esercizio arrivando ad un integrale del genere, dovremo ricordarci che<br />
esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quin<strong>di</strong><br />
torneremo su questi appunti per ricordarci quale sia il risultato dell’integrale).<br />
77
5. LE CURVE<br />
A questo punto si fa un cambiamento <strong>di</strong> variabile (ancora!), ponendo w = sec u + tan u (l’espressione<br />
al denominatore della funzione integranda), da cui dw = D(sec u + tan u)du =<br />
(sec u tan u + sec 2 u)du (ritroviamo l’espressione al numeratore della funzione integranda), da<br />
cui<br />
∫ sec 2 ∫<br />
u + sec u tan u 1<br />
du = dw = ln |w| + costante<br />
sec u + tan u<br />
w<br />
= ln | sec u + tan u| + costante<br />
Torniamo ora all’integrale <strong>di</strong> sec 3 u riscrivendo <strong>di</strong>versamente la funzione integranda:<br />
sec 3 u = sec3 u<br />
2<br />
= sec3 u<br />
2<br />
= sec3 u<br />
2<br />
= sec3 u<br />
2<br />
+ sec3 u<br />
2<br />
+ sec2 u sec u<br />
2<br />
+ (tan2 u + 1) sec u<br />
2<br />
+ tan2 u sec u<br />
+ sec u<br />
2 2<br />
= sec3 + tan 2 u sec u<br />
2<br />
+ sec u<br />
2<br />
Per calcolare l’integrale <strong>di</strong> sec 3 u dobbiamo integrare i due termini della somma in cui<br />
abbiamo scomposto sec 3 u. Del secondo termine sappiamo già quanto vale l’integrale. Per il<br />
primo, basta osservare che<br />
D(sec u tan u) = D(sec u) tan u + sec uD(tan u)<br />
= sec u tan u tan u + sec u sec 2 u<br />
= sec u tan 2 u + sec 3 u<br />
Ma allora<br />
∫ sec u tan 2 u + sec 3 ∫<br />
u 1<br />
du =<br />
2<br />
2 D(sec u tan u)du = 1 sec u tan u + costante<br />
2<br />
Ritornando all’integrale <strong>di</strong> prima e mettendo insieme i vari pezzi si ha<br />
∫<br />
sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />
2<br />
Quin<strong>di</strong> (finalmente siamo arrivati alla conclusione!!!!):<br />
∫ √1 ∫<br />
+ x2 dx = sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />
2<br />
Per tornare alla variabile originale x, da x = tan u si ha u = arctan x, da cui (sfruttando le<br />
proprietà viste prima <strong>di</strong> sec u e tan u) sec u = √ 1 + tan 2 u = √ 1 + x 2 . Perciò, sostituendo<br />
∫ √1<br />
+ x2 dx = 1 (<br />
x √ 1 + x<br />
2 2 + ln | √ )<br />
1 + x 2 + x| + costante<br />
Sappiamo ora calcolare la lunghezza della spirale <strong>di</strong> Archimede.<br />
Tornando alla formula<br />
∫ θf √<br />
L = k 1 + θ2 dθ<br />
abbiamo<br />
78<br />
L = k<br />
0<br />
[ 1<br />
(<br />
θ √ 1 + θ<br />
2 2 + ln | √ ) ] θ f<br />
1 + θ 2 + θ| = k √<br />
√<br />
)<br />
(θ f 1 + (θ f )<br />
0<br />
2<br />
2 + ln | 1 + (θ f ) 2 + θ f |
5.11. Funzioni a valori vettoriali<br />
5.11 Funzioni a valori vettoriali<br />
Abbiamo visto che una curva può essere rappresentata me<strong>di</strong>ante due equazioni parametriche<br />
che in<strong>di</strong>viduano l’ascissa e l’or<strong>di</strong>nata <strong>di</strong> ogni suo punto (se avessimo una curva nello<br />
spazio 3D avremmo tre equazioni, una per x, una per y, una per z).<br />
Queste equazioni sono un esempio <strong>di</strong> funzione a valori vettoriali. Nel caso della curva in<br />
2D possiamo definire una funzione f definita nell’insieme [t 0 , t f ] e a valori in R 2 : f : [t 0 , t f ] →<br />
R 2 tale che f = (x(t), y(t)) Al parametro t è associato il punto (x(t), y(t)), che possiamo vedere<br />
anche come un vettore <strong>di</strong> R 2 .<br />
Più in generale<br />
Definizione 5.11.1 f : I → R n con I ⊂ R k , (k, n interi) è una funzione vettoriale.<br />
Se la funzione vettoriale è data da f(t) = (f 1 (t), f 2 (t), . . . , f n (t)), possiamo calcolare la sua<br />
derivata, che è il vettore che ha come componenti le derivate delle componenti della funzione:<br />
f ′ (t) = (f 1(t), ′ f 2(t), ′ . . . , f n(t)). ′ Di questo vettore possiamo calcolare il modulo (che è una<br />
funzione <strong>di</strong> t): |f ′ (t)| = √ ∑ n<br />
i=1 (f i ′(t))2 .<br />
Nel caso 2D, se f(t) = (x(t), y(t)), si ha f ′ (t) = ( dx<br />
dt , dy<br />
dt ) e |f ′ (t)| =<br />
5.12 Le curve riviste come funzioni vettoriali<br />
Definizione 5.12.1<br />
f : [a, b] → R n<br />
G Si <strong>di</strong>ce curva <strong>di</strong> R n ogni applicazione<br />
√ (dx ) 2<br />
+<br />
dt<br />
( ) 2 dy<br />
dt<br />
G Si <strong>di</strong>ce sostegno (oppure traccia o traiettoria) della curva l’insieme f([a, b]) (il codominio<br />
della funzione).<br />
G Un curva f si <strong>di</strong>ce <strong>di</strong> classe C k se f è <strong>di</strong> classe C k ([a, b]) (cioè se ogni sua componente è <strong>di</strong><br />
classe C k ).<br />
La curva rappresentata dalla f viene detta anche curva γ.<br />
Definizione 5.12.2 Una curva γ si <strong>di</strong>ce regolare se<br />
1. la f è <strong>di</strong> classe C 1 ([a, b])<br />
2. ∀t ∈]a, b[: |f ′ (t)| > 0<br />
3. Se la f è una corrispondenza biunivoca tra [a, b] e f([a, b]) (si può avere una sola eccezione<br />
se la curva è chiusa, per cui f(a) = f(b))<br />
Definizione 5.12.3 Due funzioni vettoriali f : [a, b] → R n e g : [α, β] → R n rappresentanto la<br />
stessa curva γ se esiste una funzione Φ : [α, β] → [a, b], <strong>di</strong> classe C 1 e Φ ′ (u) > 0 ∀u ∈ [α, β], tale<br />
che Φ(α) = a Φ(β) = b<br />
G ∀u ∈ [α, β] : g(u) = (f ◦ Φ)(u) = f(Φ(u))<br />
Definizione 5.12.4 Una curva si <strong>di</strong>ce generalmente regolare o regolare a tratti se<br />
1. f è continua<br />
2. esiste un numero finito <strong>di</strong> punti a = t 0 < t 1 < . . . < t r = b tali che la f ristretta a ciascun<br />
sottointervallo [t i−1 , t i ], i = 1, 2, . . . , r rappresenti una curva regolare<br />
79
5. LE CURVE<br />
Esempio<br />
Es. 5.12.1 La curva data da<br />
x = t y = |t| − 1 ≤ t ≤ 1<br />
non è regolare perchè non è derivabile per t = 0, ma la curva è generalmente regolare<br />
perchè ristretta a [−1, 0] e [0, 1] è regolare.<br />
5.13 Retta tangente ad una curva<br />
Definizione 5.13.1 Data una curva γ <strong>di</strong> classe C 1 , data dalla funzione vettoriale<br />
f : [a, b] → R n<br />
sia t p ∈]a, b[, con f ′ (t p ) ≠ 0.<br />
Si definisce retta tangente alla curva γ nel punto f(t p ) la retta passante per f(t p ) e avente<br />
come <strong>di</strong>rezione quella del vettore f ′ (t p ):<br />
⃗r t = f(t p ) + tf ′ (t p )<br />
t ∈ R<br />
Nel caso 2D ritroviamo la retta che avevamo introdotto a pag. 66:<br />
⃗r t = (x(t p ) + dx(t p)<br />
dt<br />
t, y(t p ) + dy(t p)<br />
t)<br />
dt<br />
Definizione 5.13.2 Il vettore f ′ (t p ) si <strong>di</strong>ce vettore tangente alla curva γ in f(t p ).<br />
In R 2 il vettore tangente si in<strong>di</strong>ca anche come<br />
f ′ (t p ) = x ′ (t)⃗i + y ′ (t)⃗j<br />
5.14 Curve orientate<br />
L’orientamento naturale <strong>di</strong> una curva è quello dato da valori crescenti <strong>di</strong> t. Per <strong>di</strong>re che<br />
la curva ha l’orientamento naturale la si in<strong>di</strong>ca come +γ.<br />
L’orientamento <strong>di</strong> una curva può essere data dal versore<br />
τ(t) = f ′ (t)<br />
|f ′ (t)|<br />
Definizione 5.14.1 Data una curva γ <strong>di</strong> classe C 1 , data da f : [a, b] → R n si chiama curva<br />
opposta la curva Γ data da F : [−b, −a] → R n per la quale F(u) = f(−u)<br />
La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio<br />
per questo motivo, si può in<strong>di</strong>care con −γ la curva opposta +Γ.<br />
5.15 Di nuovo sulla lunghezza <strong>di</strong> una curva<br />
Diamo qualche cenno su come si arriva alla lunghezza <strong>di</strong> una curva.<br />
Data una curva γ <strong>di</strong> classe C 0 , sia data una sud<strong>di</strong>visione dell’intervallo [a, b] me<strong>di</strong>ante i<br />
punti a = t 0 < t 1 < . . . < t r = b. Si consideri la poligonale che congiunge i punti f(t i ). Si<br />
<strong>di</strong>ce lunghezza della curva γ l’estremo superiore dell’insieme costituito dalle lunghezze delle<br />
80
5.16. L’ascissa curvilinea<br />
poligonali così create, considerando tutte le possibili sud<strong>di</strong>visioni dell’intervallo [a, b] fatte<br />
con un numero finito <strong>di</strong> punti.<br />
Una curva che ha lunghezza finita si <strong>di</strong>ce rettificabile.<br />
Una curva regolare è rettificabile e la sua lunghezza è data da<br />
L =<br />
∫ b<br />
a<br />
|f ′ (t)|dt<br />
Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza.<br />
Per una curva regolare a tratti si ha un’analoga definizione, considerando la somma delle<br />
lunghezze delle curve regolari <strong>di</strong> cui è composta.<br />
Proposizione 5.15.1 L’integrale che fornisce la lunghezza <strong>di</strong> una curva non cambia se si<br />
considera la curva opposta a quella data o se si considera la curva me<strong>di</strong>ante rappresentazioni<br />
equivalenti.<br />
5.16 L’ascissa curvilinea<br />
Data una curva regolare orientata +γ data da f : [a, b] → R n si definisca la funzione reale<br />
s(t) data da<br />
{∫ t<br />
a |f ′ (u)|du per t ≠ a<br />
s(t) =<br />
0 per t = a<br />
Questa funzione rappresenta la lunghezza dell’arco <strong>di</strong> curva tra f(a) e f(t) ed è detta ascissa<br />
curvilinea. È una funzione crescente poichè s ′ (t) = |f ′ (t)| > 0 (essendo la curva regolare).<br />
La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che ∀s ∈ [0, L] (dove L è la<br />
lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ ′ (s) > 0.<br />
Ma, allora, f è equivalente alla funzione g = f ◦ Φ. La funzione g <strong>di</strong>pende dall’ascissa<br />
curvilinea s.<br />
La rappresentazione <strong>di</strong> una curva me<strong>di</strong>ante l’ascissa curvilinea non <strong>di</strong>pende dalla<br />
rappresentazione parametrica da cui si è partiti.<br />
Proposizione 5.16.1 La derivata <strong>di</strong> g ha modulo unitario (o norma unitaria).<br />
Dimostrazione.<br />
|g ′ (s)| = |(f ◦ Φ) ′ (s)| = |f ′ (Φ(s))Φ ′ (s)| = |f ′ (Φ(s))|Φ ′ (s)<br />
Non abbiamo considerato il modulo <strong>di</strong> Φ ′ (s) essendo questa funzione positiva e scalare.<br />
Poichè Φ è la funzione inversa <strong>di</strong> s, per la derivata vale Φ ′ 1<br />
(s) =<br />
s ′ (la derivata della<br />
(Φ(s))<br />
inversa <strong>di</strong> una funzione è uguale al reciproco della derivata della funzione stessa), andando<br />
a sostituire, si trova:<br />
|g ′ (s)| = 1<br />
✔<br />
Considerando il <strong>di</strong>fferenziale dell’ascissa curvilinea si ha la cosiddetta lunghezza dell’arco<br />
elementare:<br />
ds = |f ′ (t)|dt<br />
81
CAPITOLO 6<br />
Superfici parametriche<br />
Secondo alcuni autorevoli testi<br />
<strong>di</strong> tecnica aeronautica, il<br />
calabrone non può volare, a<br />
causa della forma e del peso<br />
del proprio corpo in rapporto<br />
alla superficie alare. Ma il<br />
calabrone non lo sa e perciò<br />
continua a volare.<br />
Igor Ivanovich Sikorsky<br />
(1889-1972)<br />
6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />
6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />
6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . . 87<br />
6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . . 87<br />
6.1 Superfici parametriche<br />
Così come una curva è stata rappresentata in forma parametrica, anche una superficie<br />
può essere rappresentata in forma parametrica me<strong>di</strong>ante tre funzioni (una per x, una per y,<br />
una per z) <strong>di</strong>pendenti da due parametri, dette equazioni parametriche della superficie<br />
x = x(u, v) y = y(u, v) z = z(u, v).<br />
Alla stessa maniera con cui abbiamo visto le equazioni <strong>di</strong> una curva parametrica come<br />
una funzione vettoriale, anche una superficie parametrica può essere vista come una<br />
funzione vettoriale che <strong>di</strong>pende da due variabili ⃗r : R 2 −→ R 3 , tale che<br />
⃗r(u, v) = (x(u, v), y(u, v), z(u, v))<br />
La funzione vettoriale è definita su una regione D del piano uv e l’insieme dei punti<br />
(x, y, z) ∈ R 3 , che sono i valori della funzione vettoriale, prende il nome <strong>di</strong> superficie<br />
parametrica S.<br />
83
6. SUPERFICI PARAMETRICHE<br />
Figura 6.1: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u.<br />
Figura 6.2: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u con 0 ≤ u ≤ π/4, 0 ≤ v ≤ 1.<br />
Esempio<br />
Es. 6.1.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />
x = 4 cos u, y = v, z = 4 sin u<br />
Cerchiamo <strong>di</strong> capire <strong>di</strong> quale superficie si tratta.<br />
Da x 2 + z 2 = 16 cos 2 u + 16 sin 2 u = 16 deduciamo che sezioni verticali parallele al piano<br />
xz, vale a <strong>di</strong>re per y costante, sono tutte circonferenze <strong>di</strong> raggio 4. Dal momento che<br />
l’equazione parametrica per y è proprio y = v, e v ∈ R, la superficie è un cilindro circolare<br />
<strong>di</strong> raggio 4 il cui asse è l’asse delle y (si veda Figura 6.1).<br />
Esempio<br />
Es. 6.1.2 Nell’esempio <strong>di</strong> prima, non c’erano limitazioni ai parametri u e v. Se invece<br />
poniamo delle limitazioni avremo una porzione <strong>di</strong> cilindro. Facciamo variare u in [0, π/4]<br />
e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo.<br />
84
6.1. Superfici parametriche<br />
Figura 6.3: Rappresentazione delle coor<strong>di</strong>nate sferiche.<br />
Se una superficie parametrica S è data dalla funzione vettoriale ⃗r(u, v), è utile definire due<br />
famiglie <strong>di</strong> curve che si trovano sulla superficie: una famiglia <strong>di</strong> curve che si ha considerando<br />
u costante e l’altra che si ha considerando v costante. Queste due famiglie corrispondono a<br />
linee verticali e orizzontali nel piano uv.<br />
Prendendo u = u 0 , la funzione vettoriale ⃗r(u 0 , v) <strong>di</strong>venta una funzione vettoriale <strong>di</strong>pendente<br />
dal solo parametro v e definisce una curva γ 1 che giace sulla superficie S. Analogamente,<br />
per v = v 0 , si ha la curva γ 2 data da ⃗r(u, v 0 ) sulla superficie S.<br />
Le due curve prendono il nome <strong>di</strong> curve coor<strong>di</strong>nate o curve <strong>di</strong> griglia. I grafici che abbiamo<br />
fatto per visualizzare le superfici <strong>degli</strong> esempi precedenti mostrano queste curve coor<strong>di</strong>nate.<br />
6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche<br />
Per visualizzare il grafico delle superfici, a volte è utile rappresentare le superfici in un<br />
sistema <strong>di</strong> coor<strong>di</strong>nate che non è quello cartesiano. Ve<strong>di</strong>amo nel dettaglio il sistema <strong>di</strong> coor<strong>di</strong>nate<br />
sferiche, dove un punto P che ha coor<strong>di</strong>nate (x, y, z) nello spazio cartesiano viene<br />
rappresentato in coor<strong>di</strong>nate sferiche me<strong>di</strong>ante (ρ, θ, φ) (si veda Figura 6.3): ρ rappresenta la<br />
<strong>di</strong>stanza del punto P dall’origine dello spazio cartesiano (ρ = √ x 2 + y 2 + z 2 ), θ rappresenta<br />
l’angolo che si ha tra la proiezione del punto P sul piano xy e l’asse positivo dell’asse x (in<br />
altri termini, è la coor<strong>di</strong>nata polare θ della proiezione <strong>di</strong> P sul piano xy), mentre φ è l’angolo<br />
tra l’asse positivo dell’asse z e il segmento OP . Quin<strong>di</strong> ρ ≥ 0 e 0 ≤ φ ≤ π. Questo sistema <strong>di</strong><br />
coor<strong>di</strong>nate è utile in presenza <strong>di</strong> simmetrie intorno all’origine.<br />
La relazione tra coor<strong>di</strong>nate cartesiane e coor<strong>di</strong>nate sferiche, tiene conto delle relazioni<br />
trigonometriche. In Figura 6.4 ve<strong>di</strong>amo i due triangoli rettangoli OP Q e OP P ′ . Il triangolo<br />
OP Q ha i lati OQ e OP <strong>di</strong> lunghezza z e ρ rispettivamente, e, per le relazioni sui lati e angoli<br />
<strong>di</strong> un triangolo rettangolo vale z = ρ cos φ. Il triangolo OP P ′ ha uno dei suoi cateti, in<strong>di</strong>cato<br />
con r, che è dato dalla proiezione <strong>di</strong> OP sul piano xy. Vale r = ρ sin φ. Le coor<strong>di</strong>nate x e y<br />
sono cateti del triangolo che si forma sul piano xy e che ha come ipotenusa proprio r, da cui<br />
x = r cos θ e y = r sin θ, vale a <strong>di</strong>re x = ρ sin φcosθ e y = ρ sin φ sin θ.<br />
Riassumendo, le coor<strong>di</strong>nate sferiche <strong>di</strong> P sono date da<br />
x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ<br />
Viceversa, considerando la formula della <strong>di</strong>stanza <strong>di</strong> un punto P dall’origine e sosituendo i<br />
85
6. SUPERFICI PARAMETRICHE<br />
Figura 6.4: Relazione tra coor<strong>di</strong>nate cartesiane e sferiche.<br />
Figura 6.5: Superficie sferica. Il grafico è fatto usando coor<strong>di</strong>nate cartesiane (a sinistra) e<br />
coor<strong>di</strong>nate sferiche (a destra).<br />
valori appena trovati si ricava:<br />
√<br />
x2 + y 2 + z 2 =<br />
√<br />
ρ 2 sin 2 φ cos 2 θ + ρ 2 sin 2 φ sin 2 θ + ρ 2 cos 2 φ = ρ<br />
Esempio<br />
Es. 6.1.3 L’equazione <strong>di</strong> una sfera <strong>di</strong> centro l’origine e raggio r è data da x 2 +y 2 +z 2 = r 2 .<br />
Possiamo descrivere la sfera usando equazioni parametriche del tipo<br />
x = x, y = y, z = ± √ r 2 − x 2 − y 2<br />
Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici,<br />
otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappresentate<br />
ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e,<br />
in corrispondenza dei buchi abbiamo delle ra<strong>di</strong>ci quadrate <strong>di</strong> valori negativi! Se usiamo<br />
invece coor<strong>di</strong>nate sferiche, i punti hanno coor<strong>di</strong>nate con ρ = r, da cui,<br />
x = r sin φ cos θ, y = r sin φ sin θ, z = r cos φ, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π<br />
86
6.2. Piano tangente a una superficie parametrica<br />
Il grafico della sfera usando le coor<strong>di</strong>nate sferiche è in Figura 6.5 a destra. Osserviamo<br />
come la superficie sia ben rappresentata. In questo caso le curve coor<strong>di</strong>nate<br />
per φ costante sono delle circonferenze <strong>di</strong> valore costante (che corrispondono ai noti<br />
paralleli che si stu<strong>di</strong>ano in geografia). Per θ costante abbiamo invece i meri<strong>di</strong>ani<br />
(semicirconferenze perchè 0 ≤ φ ≤ π) che collegano polo nord e polo sud.<br />
6.2 Piano tangente a una superficie parametrica<br />
Data una superficie parametrica S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), vogliamo<br />
calcolare l’equazione del piano tangente alla superficie in un punto P 0 (x 0 , y 0 , z 0 ) che vi<br />
appartiene. Esiste quin<strong>di</strong> una coppia <strong>di</strong> valori (u 0 , v 0 ) tale che P 0 = ⃗r(u 0 , v 0 ).<br />
Per calcolare il piano tangente, facciamo questo tipo <strong>di</strong> ragionamento. Fissando u =<br />
u 0 , le equazioni parametriche della superficie <strong>di</strong>ventano ⃗r(u 0 , v) = (x(u 0 , v), y(u 0 , v), z(u 0 , v)):<br />
abbiamo una funzione vettoriale che <strong>di</strong>pende dalla sola variabile v e che definisce una curva<br />
parametrica γ 1 nello spazio R 3 . Questa curva giace sulla superficie S.<br />
Scriviamo le equazioni parametriche della retta tangente a questa curva (si veda pag. 80),<br />
considerando che quella che è la derivata della funzione x(u 0 , v) rispetto a v nel punto v = v 0<br />
altro non è che la derivata parziale della funzione x(u, v) rispetto a v nel punto (u 0 , v 0 ) (stesso<br />
<strong>di</strong>scorso vale per y e per z). Otteniamo<br />
retta ⃗ tv = (x 0 + t ∂x(u 0, v 0 )<br />
∂v<br />
, y 0 + t ∂y(u 0, v 0 )<br />
∂v<br />
, z 0 + t ∂z(u 0, v 0 )<br />
)<br />
∂v<br />
Abbiamo chiamato questa retta con retta ⃗ tv perchè è la retta tangente alla curva che <strong>di</strong>pende<br />
dalla variabile v poichè u = u 0 costante. Di conseguenza, la pendenza <strong>di</strong> questa retta, vale a<br />
<strong>di</strong>re, la tangente alla curva γ 1 nel punto x(u 0 , v 0 ), y(u 0 , v 0 ) è data dal vettore<br />
⃗r tv = ( ∂x(u 0, v 0 )<br />
∂v<br />
, ∂y(u 0, v 0 )<br />
∂v<br />
, ∂z(u 0, v 0 )<br />
)<br />
∂v<br />
Allo stesso modo, possiamo fissare v = v 0 e considerare che le equazioni parametriche della<br />
superficie, in questo caso, si riducono alle equazioni parametriche <strong>di</strong> una curva nello<br />
spazio R 3 che <strong>di</strong>pendono dalla variabile u. Analogamente, possiamo scrivere le equazioni<br />
parametriche della retta tangente a questa curva nel punto P 0 , ottenendo<br />
retta ⃗ tu = (x 0 + t ∂x(u 0, v 0 )<br />
∂u<br />
, y 0 + t ∂y(u 0, v 0 )<br />
∂u<br />
La pendenza <strong>di</strong> questa retta è data dal vettore<br />
⃗r tu = ( ∂x(u 0, v 0 )<br />
∂u<br />
, ∂y(u 0, v 0 )<br />
∂u<br />
, ∂z(u 0, v 0 )<br />
)<br />
∂u<br />
, z 0 + t ∂z(u 0, v 0 )<br />
)<br />
∂u<br />
Una volta ottenute queste due rette, il piano tangente alla superficie è il piano in<strong>di</strong>viduato<br />
dalle <strong>di</strong>rezioni <strong>di</strong> queste due rette, cioè dai due vettori ⃗r tu e ⃗r tv . Consideriamo dei brevi<br />
richiami sulle equazioni <strong>di</strong> un piano in R 3 .<br />
6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano<br />
Supponiamo <strong>di</strong> avere un punto P 0 = (x 0 , y 0 , z 0 ) su un piano nello spazio R 3 . Supponiamo<br />
<strong>di</strong> avere anche un vettore ⃗n che è normale a questo piano:<br />
Assumiamo <strong>di</strong> conoscere un altro generico punto P = (x, y, z) che giace sul piano.<br />
In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si<br />
veda figura 6.6). Possiamo costruire il vettore ⃗r − ⃗r 0 che giace interamente nel piano. Per<br />
87
6. SUPERFICI PARAMETRICHE<br />
Figura 6.6: piano nello spazio<br />
semplicità, nella figura 6.6 abbiamo messo sul piano il vettore ⃗n (anche se esso potrebbe<br />
stare da tutt’altra parte). Ora, poichè ⃗n è ortogonale al piano, esso è ortogonale ad ogni<br />
vettore che giace nel piano. In particolare esso è ortogonale al vettore ⃗r − ⃗r 0 . Vale dunque:<br />
⃗n · (⃗r − ⃗r 0 ) = 0<br />
Se ⃗n è un vettore <strong>di</strong> componenti (a, b, c), poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 , z − z 0 ), il prodotto<br />
scalare <strong>di</strong>venta<br />
a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />
Questa è l’equazione scalare del piano. Spesso troviamo l’equazione scritta nella forma<br />
ax + by + cz = d dove d = ax 0 + by 0 + cz 0<br />
Osserviamo quin<strong>di</strong> che, data l’equazione <strong>di</strong> un piano possiamo ricavare facilmente un vettore<br />
normale al piano: esso è dato da ⃗n = (a, b, c).<br />
Ora, dati due vettori ⃗a e ⃗ b in R 3 , il prodotto vettoriale ⃗a × ⃗ b è un vettore che punta nella<br />
<strong>di</strong>rezione perpen<strong>di</strong>colare al piano in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b, mentre la sua lunghezza<br />
è data da<br />
|⃗a × ⃗ b| = |⃗a|| ⃗ b| sin θ<br />
dove θ è l’angolo compreso dai due vettori (0 ≤ θ ≤ π). Da questa formula deduciamo che<br />
se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come<br />
interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l’area<br />
del parallelogramma in<strong>di</strong>viduato dai vettori ⃗a e ⃗ b. Per trovare le componenti del prodotto<br />
vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i<br />
versori dell’asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti<br />
del vettore ⃗a e sulla terza riga le componenti del vettore ⃗ b. Si calcola il determinante della<br />
matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia ⃗a = (a 1 , a 2 , a 3 )<br />
e ⃗ b = (b 1 , b 2 , b 3 ). I versori unitari dei tre assi siano dati da ⃗i, ⃗j, ⃗ k. Il prodotto vettoriale ⃗a × ⃗ b è<br />
dato da<br />
∣ ⃗a × ⃗ ⃗i ⃗j ⃗ k ∣∣∣∣∣ b =<br />
a 1 a 2 a 3 =⃗i<br />
∣ a ∣ 2 a 3∣∣∣<br />
− ⃗j<br />
∣<br />
b 2 b 3<br />
∣ a ∣ 1 a 3∣∣∣<br />
+<br />
b 1 b ⃗ k<br />
3<br />
∣ a ∣<br />
1 a 2∣∣∣<br />
b 1 b 2<br />
b 1 b 2 b 3<br />
88<br />
=⃗i(a 2 b 3 − b 2 a 3 ) − ⃗j(a 1 b 3 − b 1 a 3 ) + ⃗ k(a 1 b 2 − b 1 a 2 )<br />
= (a 2 b 3 − b 2 a 3 , b 1 a 3 − a 1 b 3 , a 1 b 2 − b 1 a 2 )
6.2. Piano tangente a una superficie parametrica<br />
Quin<strong>di</strong> se abbiamo due vettori ⃗a e ⃗ b che si trovano sul piano <strong>di</strong> cui vogliamo scrivere l’equazione,<br />
il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per<br />
scrivere l’equazione del piano tangente.<br />
Tornando al piano tangente ad una superficie parametrica in un punto P 0 , poichè abbiamo<br />
trovato i due vettori tangenti ⃗r tu e ⃗r tv che si trovano sul piano tangente alla superficie,<br />
allora il piano tangente è in<strong>di</strong>viduato dal vettore ⃗n = ⃗r tu × ⃗r tv (i due vettori non devono essere<br />
tangenti tra loro).<br />
Esempio<br />
Es. 6.2.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />
x = 2u 2 , y = 3v 2 , z = 3u + 5v<br />
Vogliamo trovare l’equazione del piano tangente alla superficie nel punto P 0 (2, 3, 8).<br />
Notiamo che questo punto si ha per u = v = 1.<br />
Calcoliamo i due vettori tangenti ⃗r tu e ⃗r tv .<br />
Poichè<br />
∂x<br />
∂u = 4u,<br />
∂y<br />
∂u = 0,<br />
∂z<br />
∂u = 3<br />
valutando queste derivate in (1, 1) abbiamo<br />
⃗r tu = (4, 0, 3)<br />
Analogamente, poichè<br />
∂x<br />
∂v = 0,<br />
∂y<br />
∂v = 6v,<br />
∂z<br />
∂v = 5<br />
valutando queste derivate in (1, 1) abbiamo<br />
⃗r tv = (0, 6, 5)<br />
Il prodotto vettoriale è<br />
⃗i ⃗j ⃗ k<br />
⃗r tu × ⃗r tv =<br />
4 0 3<br />
∣0 6 5∣ = (−18) ⃗i − (12)⃗j + (24) ⃗ k = (−18, −12, 24)<br />
Quin<strong>di</strong> il piano tangente è dato da<br />
a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />
dove (a, b, c) = (−18, −12, 24) e (x 0 , y 0 , z 0 ) = (2, 3, 8) = P 0 , da cui<br />
o ancora<br />
−18(x − 2) − 12(y − 3) + 24(z − 8) = 0<br />
−18x + 36 − 12y + 36 + 24z − 192 = 0 =⇒ 24z − 12y − 18x − 120 = 0 =⇒ 2z − y − 1.5x − 10 = 0<br />
89
CAPITOLO 7<br />
Integrali<br />
Compito della scienza non è<br />
aprire una porta all’infinito<br />
sapere, ma porre una barriera<br />
all’infinita ignoranza.<br />
Galileo Galilei (1564-1642)<br />
7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />
7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . . 91<br />
7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . . 92<br />
7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />
7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />
7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />
7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />
7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />
7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />
7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />
7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />
7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />
7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />
7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />
7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />
7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />
7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />
7.1 Integrali <strong>di</strong>pendenti da parametri<br />
Analizziamo brevemente gli integrali <strong>di</strong>pendenti da parametri, vedendo il caso in cui la<br />
funzione integranda <strong>di</strong>pende da una sola variabile e il caso in cui <strong>di</strong>pende da due variabili.<br />
7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile<br />
Se f : I −→ R con I ⊂ R è una funzione continua, fissato x 0 ∈ I si può definire la funzione<br />
F (x) =<br />
∫ x<br />
x 0<br />
f(t)dt<br />
Questa funzione prende il nome <strong>di</strong> funzione integrale della f <strong>di</strong> punto iniziale x 0 .<br />
91
7. INTEGRALI<br />
Proposizione 7.1.1 Se G è una primitiva della f (quin<strong>di</strong> G ′ = f) si ha<br />
F (x) =<br />
∫ x<br />
x 0<br />
f(t)dt = G(x) − G(x 0 )<br />
La funzione F è a sua volta una primitiva <strong>di</strong> f.<br />
Dimostrazione. Infatti F ′ (x) = d ( ∫ x<br />
dx<br />
x 0<br />
f(t)dt)<br />
= d(G(x) − g(x 0))<br />
= f(x). ✔<br />
dx<br />
7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili<br />
Se f : I −→ R con I ⊂ R 2 è una funzione continua, si può definire la funzione<br />
F (y 0 , y 1 , x) =<br />
∫ y1<br />
y 0<br />
f(x, y)dy<br />
Quin<strong>di</strong>, fissato un certo valore <strong>di</strong> x, calcoliamo l’integrale della funzione f(x, y), come funzione<br />
che <strong>di</strong>pende solo da y, per y 0 ≤ y ≤ y 1 . Al variare <strong>di</strong> x varia l’integrale. E l’integrale varia<br />
anche al variare <strong>di</strong> y 0 e y 1 , perciò è una funzione che <strong>di</strong>pende da tre variabili, y 0 , y 1 e x.<br />
La F è una funzione continua.<br />
Proposizione 7.1.2 Se f è continua, la F è derivabile rispetto a y 0 e y 1 e vale<br />
∂F<br />
∂y 1<br />
= f(x, y 1 )<br />
∂F<br />
∂y 0<br />
= −f(x, y 0 )<br />
Dimostrazione.<br />
La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y 1 (che<br />
è il secondo estremo dell’intervallo <strong>di</strong> integrazione), posso considerare la F come funzione<br />
integrale <strong>di</strong> una funzione <strong>di</strong>pendente da una sola variabile. In particolare, fissati x e y 0 ,<br />
considero la funzione g(y) = f(x, y) e<br />
F 1 (y 1 ) = F (y 0 , y 1 , x) =<br />
∫ y1<br />
y 0<br />
g(y)dy<br />
Mi riconduco dunque al caso visto prima, da cui F ′ 1(y 1 ) = g(y 1 ). Ma g(y 1 ) = f(x, y 1 ) e F ′ 1(y 1 )<br />
altro non è che la derivata della funzione F per y 0 e x fissati, quin<strong>di</strong> F ′ 1(y 1 ) = ∂F (y 0, y 1 , x)<br />
∂y 1<br />
Ricaviamo dunque<br />
∂F (y 0 , y 1 , x)<br />
∂y 1<br />
= f(x, y 1 )<br />
Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare<br />
che ∫ b<br />
a g(x)dx = − ∫ a<br />
g(x)dx da cui<br />
b<br />
∫ y1<br />
∫ y0<br />
f(x, y)dy = − f(x, y)dy<br />
y 0<br />
y 1<br />
92
7.2. Richiamo sugli integrali semplici<br />
Utilizzando questa formula e il risultato precendente, e scambiando il ruolo <strong>di</strong> y 0 e y 1<br />
troviamo che vale 1<br />
∂F (y 0 , y 1 , x)<br />
∂y 0<br />
= −f(x, y 0 )<br />
✔<br />
Si può pensare, della F <strong>di</strong> voler calcolare anche la derivata parziale rispetto alla x. In tal<br />
caso vale la relazione<br />
∫<br />
∂F<br />
y1<br />
∂x = ∂f(x, y)<br />
dy<br />
y 0<br />
∂x<br />
Valgono inoltre le seguenti proposizioni<br />
Proposizione 7.1.3 Se f è <strong>di</strong> classe C 1 anche F è <strong>di</strong> classe C 1 .<br />
Se si fa variare y in un certo intervallo definito da due funzioni <strong>di</strong>pendenti da x: α(x) ≤<br />
y ≤ β(x), con α e β funzioni <strong>di</strong> classe C 0 , possiamo definire la funzione<br />
F (x) =<br />
∫ β(x)<br />
α(x)<br />
f(x, y)dy<br />
Proposizione 7.1.4 Se le funzioni f, α e β sono <strong>di</strong> classe C 1 allora anche la funzione F (x) =<br />
∫ β(x)<br />
α(x) f(x, y)dy è <strong>di</strong> classe C1 e vale<br />
∫ β(x)<br />
F ′ (x) = f(x, β(x))β ′ (x) − f(x, α(x))α ′ (x) +<br />
α(x)<br />
Dimostrazione. Ve<strong>di</strong>amo F (x) = F (α(x), β(x), x).<br />
Allora, per la derivazione delle funzioni composte:<br />
F ′ (x) =<br />
∂F<br />
∂α(x) α′ (x) +<br />
∂F<br />
∂β(x) β′ (x) + ∂F<br />
∂x<br />
∂f(x, y)<br />
dy<br />
∂x<br />
Applicando i risultati già visti per ciascuna <strong>di</strong> queste derivate parziali, ritroviamo l’asserto.<br />
✔<br />
7.2 Richiamo sugli integrali semplici<br />
Prima <strong>di</strong> vedere cosa sono gli integrali multipli (doppi o tripli), rive<strong>di</strong>amo brevemente cosa<br />
è un integrale definito <strong>di</strong> una funzione che <strong>di</strong>pende da una sola variabile:<br />
∫ b<br />
a<br />
f(x)dx<br />
1 Possiamo pensare <strong>di</strong> riscrivere la F come F (y 0 , y 1 , x) = R y 1<br />
y f(x, y)dy = − R y 0<br />
0 y f(x, y)dy = −G(y<br />
1<br />
1 , y 0 , x) dove<br />
G(y 1 , y 0 , x) = R y 0<br />
y f(x, y)dy<br />
1<br />
Di G (avendo scambiato il ruolo <strong>di</strong> y 0 e y 1 ) sappiamo qual è la derivata rispetto a y 0 (secondo estremo <strong>di</strong><br />
integrazione):<br />
Allora<br />
∂G<br />
∂y 0<br />
= f(x, y 0 )<br />
∂F (y 0 , y 1 , x)<br />
∂y 0<br />
Ritroviamo dunque l’asserto.<br />
= − ∂G<br />
∂y 0<br />
= −f(x, y 0 )<br />
93
7. INTEGRALI<br />
Figura 7.1:<br />
Come si arriva alla definizione <strong>di</strong> ∫ b<br />
a f(x)dx.<br />
dove a ≤ x ≤ b. Per integrali <strong>di</strong> questo tipo, <strong>di</strong>ciamo che stiamo integrando la funzione f(x)<br />
nell’intervallo [a, b]. I punti a e b si <strong>di</strong>cono estremi dell’intervallo <strong>di</strong> integrazione.<br />
Il concetto <strong>di</strong> integrale <strong>di</strong> una funzione si deriva considerando l’area che si trova sotto la<br />
curva definita da y = f(x) nell’intervallo [a, b] (supponiamo per semplicità che la funzione f<br />
sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi<br />
che negativi... il valore <strong>di</strong> un integrale può essere sia positivo che negativo, a seconda della<br />
funzione da integrare).<br />
Per calcolare l’area sottesa dalla funzione y = f(x) possiamo pensare <strong>di</strong> <strong>di</strong>videre l’intervallo<br />
[a, b] in n parti uguali, in modo da avere n sottointervalli <strong>di</strong> ampiezza ∆x. In ciascuno<br />
<strong>di</strong> questi sottointervalli scegliamo un punto x ∗ i (ad esempio il punto me<strong>di</strong>o <strong>di</strong> ciascuno dei<br />
sottointervalli) e consideriamo il rettangolo <strong>di</strong> ampiezza ∆x e altezza f(x ∗ i ) (si veda Figura<br />
7.1). Ciascuno <strong>di</strong> questi rettangoli ha area pari a f(x ∗ i )∆x, quin<strong>di</strong> l’integrale può essere<br />
approssimato me<strong>di</strong>ante la somma delle aree <strong>di</strong> ciascun rettangolo:<br />
∫ b<br />
a<br />
f(x)dx ≈ f(x ∗ 1)∆x + f(x ∗ 2)∆x + . . . + f(x ∗ n)∆x)<br />
Per ottenere l’area esatta della nostra funzione, facciamo il limite per n che tende<br />
all’infinito.<br />
∫ b<br />
a<br />
f(x)dx = lim<br />
n→∞<br />
i=1<br />
n∑<br />
f(x ∗ i )∆x<br />
7.3 Integrali doppi su domini rettangolari<br />
Ve<strong>di</strong>amo ora cosa accade se abbiamo una funzione <strong>di</strong> due variabili f(x, y). Se per funzioni<br />
<strong>di</strong> una sola variabile integriamo su un intervallo (un sottoinsieme <strong>di</strong> R), per funzioni <strong>di</strong> due<br />
variabili ha senso integrare su una regione <strong>di</strong> R 2 .<br />
Assumiamo <strong>di</strong> avere una regione <strong>di</strong> R 2 data dal rettangolo D = [a, b] × [c, d]. Ciò vuol <strong>di</strong>re<br />
che a ≤ x ≤ b mentre c ≤ y ≤ d.<br />
Sia, inoltre, f(x, y) ≥ 0 per ogni coppia <strong>di</strong> punti (x, y) ∈ D, anche se quanto <strong>di</strong>remo ora si<br />
può estendere al caso più generale <strong>di</strong> funzioni che assumono valori sia positivi che negativi.<br />
La domanda che ci poniamo è la seguente: qual è il volume della regione che si trova<br />
sotto il grafico della funzione f(x, y) e sopra il piano xy (si veda Figura 7.2)<br />
Per prima cosa cerchiamo <strong>di</strong> approssimare il volume (in maniera analoga a quanto abbiamo<br />
fatto per l’area nel caso <strong>di</strong> funzioni <strong>di</strong> una sola variabile). Per far ciò <strong>di</strong>vi<strong>di</strong>amo l’intervallo<br />
[a, b] in n parti uguali e l’intervallo [c, d] in m parti uguali, in modo da <strong>di</strong>videre D in tanti<br />
94
7.3. Integrali doppi su domini rettangolari<br />
Figura 7.2: Grafico <strong>di</strong> una funzione f(x, y) sul rettangolo D.<br />
Figura 7.3:<br />
Sud<strong>di</strong>visione del rettangolo D in tanti rettangolini.<br />
rettangolini (ne abbiamo n × m) e, in ciascuno <strong>di</strong> questi, scegliamo un punto <strong>di</strong> coor<strong>di</strong>nate<br />
(x ∗ i , y∗ j ) (si veda Figura 7.3).<br />
Su ciascuno <strong>di</strong> questi rettangolini, costruiamo una colonnina (un parallelogramma) <strong>di</strong><br />
altezza data da f(x ∗ i , y∗ j ). Ciascuno dei parallelogrammi ha un volume dato da f(x∗ i , y∗ j )∆x∆y.<br />
Approssiamo il volume V che si trova sotto il grafico della funzione f(x, y) sommando i<br />
volumi <strong>di</strong> ciascun parallelogramma<br />
V ≈<br />
n∑<br />
i=1 j=1<br />
m∑<br />
f(x ∗ i , yj ∗ )∆x∆y<br />
Prendendo sud<strong>di</strong>visioni lungo l’asse x e y via via più raffinate, facendo cioè tendere<br />
all’infinito n e m noi avremo una stima via via più accurata del volume V , vale a <strong>di</strong>re<br />
V =<br />
lim<br />
n∑<br />
n,m→∞<br />
i=1 j=1<br />
m∑<br />
f(x ∗ i , yj ∗ )∆x∆y<br />
A questo punto abbiamo la definizione <strong>di</strong> integrale doppio (si noti la somiglianza con la<br />
definizione data per integrale definito per funzioni <strong>di</strong> una singola variabile).<br />
95
7. INTEGRALI<br />
In<strong>di</strong>chiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo<br />
D proprio il volume V :<br />
∫∫<br />
D<br />
f(x, y)dA =<br />
lim<br />
7.4 Integrali iterati<br />
n∑<br />
n,m→∞<br />
i=1 j=1<br />
m∑<br />
f(x ∗ i , yj ∗ )∆x∆y.<br />
Supponiamo che f sia una funzione continua nel rettangolo D = [a, b]×[c, d]. Utilizziamo la<br />
notazione ∫ d<br />
f(x, y)dy per <strong>di</strong>re che x è costante e si integra la funzione rispetto alla variabile y<br />
c<br />
per y che varia da c a d. Una volta che abbiamo calcolato questo integrale, avremo un valore<br />
che <strong>di</strong>pende dal valore <strong>di</strong> x, quin<strong>di</strong> questo integrale definisce una funzione <strong>di</strong> x:<br />
A(x) =<br />
∫ d<br />
c<br />
f(x, y)dy<br />
Adesso integriamo A rispetto a x, per x che varia in [a, b], ottenendo<br />
∫ b ∫ [<br />
b ∫ ]<br />
d<br />
A(x)dx = f(x, y)dy dx<br />
a<br />
a<br />
c<br />
L’integrale scritto a destra dell’equazione precedente prende il nome <strong>di</strong> integrale iterato. Di<br />
solito non si mettono le parentesi ma si scrive <strong>di</strong>rettamente ∫ b ∫ d<br />
f(x, y)dydx: quin<strong>di</strong> prima<br />
a c<br />
integriamo rispetto a y da c a d e poi integriamo rispetto a x da a a b.<br />
Alla stessa maniera si può definire l’integrale iterato dato da<br />
∫ d ∫ b<br />
∫ [<br />
d ∫ ]<br />
b<br />
f(x, y)dxdy = f(x, y)dx dy<br />
c<br />
a<br />
c<br />
a<br />
In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a<br />
y da c a d.<br />
Esempio<br />
Es. 7.4.1 Valutiamo ∫ 4 ∫ 3<br />
0 2 xy2 dydx.<br />
Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo<br />
∫ 3<br />
2<br />
xy 2 dy =<br />
] 3 [x y3<br />
3<br />
2<br />
= x 33<br />
3 − x23 3 = 19 3 x<br />
Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima.<br />
Integriamo questa funzione per x che varia da 0 a 4. Otteniamo<br />
∫ 4 ∫ 3<br />
0<br />
2<br />
xy 2 dydx =<br />
=<br />
∫ 4<br />
0<br />
∫ 4<br />
0<br />
[∫ 3<br />
2<br />
]<br />
xy 2 dy dx<br />
[<br />
19 19<br />
3 xdx = 3<br />
x 2 ] 4<br />
= 19<br />
2<br />
0<br />
3 8 = 152<br />
3<br />
96
7.5. Integrali doppi su domini generali<br />
Esempio<br />
Es. 7.4.2 Proviamo ora a calcolare ∫ 3 ∫ 4<br />
2 0 xy2 dxdy.<br />
Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo<br />
∫ 3 ∫ 4<br />
2<br />
0<br />
xy 2 dxdy =<br />
∫ 3<br />
2<br />
∫ 3<br />
[∫ 4<br />
0<br />
]<br />
xy 2 dx dy<br />
[ ] x<br />
2 4<br />
=<br />
2 2 y2 dy<br />
0<br />
∫ 3<br />
] 3<br />
= 8y 2 dy =<br />
[8 y3<br />
2<br />
3<br />
2<br />
= 8( 33<br />
3 − 23<br />
3 ) = 152<br />
3<br />
Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l’or<strong>di</strong>ne <strong>di</strong><br />
integrazione. Si ha infatti il seguente teorema.<br />
Teorema 7.4.1 (<strong>di</strong> Fubini) Se f(x, y) è una funzione continua su D = [a, b] × [c, d] allora:<br />
o,<br />
∫∫<br />
f(x, y)dA =<br />
∫ b ∫ d<br />
f(x, y)dydx =<br />
∫ d ∫ b<br />
D<br />
a c<br />
c a<br />
∫∫<br />
f(x, y)dA =<br />
∫ b<br />
( ∫ )<br />
d<br />
f(x, y)dy dx =<br />
∫ d<br />
D<br />
a c<br />
c a<br />
f(x, y)dxdy<br />
( ∫ )<br />
b<br />
f(x, y)dx dy<br />
Quin<strong>di</strong> abbiamo due strade equivalenti per calcolare un integrale doppio <strong>di</strong> una funzione<br />
continua su un dominio rettangolare, riconducendoci a integrali <strong>di</strong> una sola variabile che<br />
sappiamo calcolare. Riassumendo:<br />
G nel primo caso<br />
∫∫<br />
∫ b ∫ d<br />
∫ (<br />
b ∫ )<br />
d<br />
f(x, y)dA = f(x, y)dydx = f(x, y)dy dx<br />
D<br />
a<br />
c<br />
a<br />
noi prima calcoliamo l’integrale che sta all’interno (tra parentesi tonde), vale a <strong>di</strong>re,<br />
∫ d<br />
f(x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Come<br />
risultato avremo una funzione che <strong>di</strong>pende solo da x e sarà questa che poi andremo<br />
c<br />
a integrare tra a e b rispetto alla variabile x;<br />
G nel secondo caso<br />
∫∫<br />
∫ d ∫ b<br />
∫ (<br />
d ∫ )<br />
b<br />
f(x, y)dA = f(x, y)dxdy = f(x, y)dx dy<br />
D<br />
c<br />
a<br />
c<br />
an<strong>di</strong>amo prima a calcolare l’integrale ∫ b<br />
f(x, y)dx rispetto a x, considerando y come una<br />
a<br />
costante e poi andremo a integrare il risultato ottenuto rispetto a y nell’intervallo [c, d].<br />
7.5 Integrali doppi su domini generali<br />
A <strong>di</strong>fferenza <strong>degli</strong> integrali <strong>di</strong> funzioni <strong>di</strong> una sola variabile, in cui il dominio <strong>di</strong> integrazione<br />
è sempre un intervallo, per integrali <strong>di</strong> funzioni <strong>di</strong> due variabili, il dominio <strong>di</strong> integrazione<br />
c<br />
a<br />
97
7. INTEGRALI<br />
Figura 7.4:<br />
Dominio normale rispetto all’asse x (sinistra) e rispetto all’asse y (destra).<br />
non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso<br />
in cui il dominio <strong>di</strong> integrazione sia un insieme limitato D (perciò esiste un rettangolo R che<br />
lo contiene).<br />
In tal caso l’integrale <strong>di</strong> una funzione f(x, y) sul dominio R si può ricondurre all’integrale<br />
<strong>di</strong> una funzione F (x, y) sul rettangolo R così definita:<br />
{<br />
f(x, y) se (x, y) appartiene a D<br />
F (x, y) =<br />
0 se (x, y) appartiene a R ma non a D<br />
Allora<br />
∫∫<br />
D<br />
∫∫<br />
f(x, y)dA =<br />
R<br />
F (x, y)dA<br />
Da un punto <strong>di</strong> vista pratico, come calcolare questo integrale La frontiera dell’insieme<br />
D deve potersi esprimere me<strong>di</strong>ante funzioni continue <strong>di</strong> x o <strong>di</strong> y. Ci sono due casi da<br />
considerare (si vedano Figure 7.4 e 7.5 per <strong>degli</strong> esempi)<br />
1. Caso 1: l’insieme D è dato da<br />
{<br />
}<br />
D = (x, y) ∈ R 2 t. c. a ≤ x ≤ b, g 1 (x) ≤ y ≤ g 2 (x)<br />
Si <strong>di</strong>ce che il dominio è normale rispetto all’asse x.<br />
2. Caso 2: l’insieme D è dato da<br />
{<br />
}<br />
D = (x, y) ∈ R 2 t. c. h 1 (y) ≤ x ≤ h 2 (y), c ≤ y ≤ d<br />
Si <strong>di</strong>ce che il dominio è normale rispetto all’asse y.<br />
Se il dominio è normale rispetto all’asse x, vuol <strong>di</strong>re che prendendo una retta x = x 0<br />
con a ≤ x 0 ≤ b, (normale dunque all’asse x), i valori <strong>di</strong> y che sono compresi tra g 1 (x 0 ) e<br />
g 2 (x 0 ) giacciono tutti all’interno del dominio <strong>di</strong> integrazione. Analogamente, nel caso in cui<br />
il dominio sia normale rispetto all’asse y, prendendo la retta y = y 0 normale all’asse y, con<br />
c ≤ y 0 ≤ d, si ha che tutti i punti <strong>di</strong> or<strong>di</strong>nata y 0 e <strong>di</strong> ascissa compresa tra h 1 (y 0 ) e h 2 (y 0 ) sono<br />
all’interno del dominio <strong>di</strong> integrazione.<br />
In questi casi, il teorema <strong>di</strong> Fubini applicato al rettangolo R in cui uno dei due lati<br />
corrisponde con l’intervallo [a, b] o [c, d] a seconda che il dominio sia normale rispetto all’asse<br />
x o y, si riduce ad un integrale iterato in cui gli estremi dell’integrale interno (da calcolare<br />
per primo) sono dati proprio dalle due funzioni g 1 , g 2 , o h 1 , h 2 che delimitano la frontiera <strong>di</strong><br />
D, in quanto all’esterno la funzione F è nulla. Si ha il seguente teorema.<br />
Teorema 7.5.1 (<strong>di</strong> Fubini) Data una funzione f(x, y) da integrare su un dominio D,<br />
98
7.5. Integrali doppi su domini generali<br />
}<br />
Figura 7.5: A sinitra: D =<br />
{(x, y) ∈ R 2 : 1 ≤ y ≤ 2, y ≤ x ≤ y 3 . Il dominio è normale rispetto<br />
{<br />
all’asse y. A destra: D = (x, y) ∈ R 2 : 0 ≤ x ≤ 1, x 3 ≤ y ≤ √ }<br />
x . Il dominio è normale rispetto<br />
all’asse x.<br />
Figura 7.6: Dominio dato dal triangolo <strong>di</strong> vertici (0, 3), (1, 1) e (5, 3)<br />
G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse x (Caso 1) si ha:<br />
∫∫<br />
∫ b ∫ g2(x)<br />
f(x, y)dA = f(x, y)dydx<br />
D<br />
a<br />
g 1(x)<br />
G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse y (Caso 2) si ha:<br />
∫∫<br />
∫ d ∫ h2(y)<br />
f(x, y)dA =<br />
f(x, y)dxdy<br />
D<br />
c<br />
h 1(y)<br />
Esaminiamo il Caso 1 (il <strong>di</strong>scorso si ripete analogo per il Caso 2). Noi calcoliamo prima<br />
l’integrale interno ∫ g 2(x)<br />
g 1(x)<br />
f(x, y)dy considerando x come costante, rispetto alla variabile y. Il<br />
risultato ora <strong>di</strong>pende da x in quanto gli estremi <strong>di</strong> integrazione sono funzioni <strong>di</strong> x. Una volta<br />
ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b.<br />
A volte, un dominio può essere considerato normale sia rispetto all’asse x sia rispetto<br />
all’asse y. Altre volte può essere visto come unione <strong>di</strong> due domini. A seconda dell’integrale<br />
che si deve fare, conviene scegliere <strong>di</strong> vederlo in un modo piuttosto che in un altro.<br />
99
7. INTEGRALI<br />
Esempio<br />
Es. 7.5.1 Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto come<br />
l’unione <strong>di</strong> due domini normali rispetto all’asse x, oppure come un dominio normale<br />
rispetto all’asse y.<br />
Nel primo caso, D = D 1 ∪ D 2 , in quanto la funzione g 1 (x) varia a seconda <strong>di</strong> dove si trovi<br />
x:<br />
D 1 = {(x, y) t.c. 0 ≤ x ≤ 1, −2x + 3 ≤ y ≤ 3}<br />
{<br />
1<br />
D 2 = (x, y) t.c. 1 ≤ x ≤ 5,<br />
2 x + 1 }<br />
2 ≤ y ≤ 3<br />
Se riscriviamo le equazioni delle due rette y = −2x + 3 e y = 1 2 x + 1 2<br />
in funzione <strong>di</strong> x<br />
otteniamo, dalla prima, x = − 1 2 y + 3 , e dalla seconda x = 2y − 1, e possiamo scrivere<br />
2<br />
l’insieme D come<br />
D =<br />
{(x, y) t.c. − 1 2 y + 3 }<br />
2 ≤ x ≤ 2y − 1, 1 ≤ y ≤ 3<br />
Esempio<br />
Es. 7.5.2 Calcoliamo ∫∫ D x2 dA dove D è l’insieme delimitato dalle parabole y = 3x 2 e<br />
y = x 2 + 2. Prima <strong>di</strong> tutta facciamo un grafico dell’insieme D (si veda Figura 7.7). I punti<br />
<strong>di</strong> intersezione delle due parabole si hanno per 3x 2 = x 2 + 2 cioè 2x 2 − 2 = vale a <strong>di</strong>re per<br />
x = ±1. Si vede facilmente che il dominio è normale rispetto all’asse x: basta considerare<br />
−1 ≤ x ≤ 1 e 3x 2 ≤ y ≤ x 2 + 2. Infatti la curva che delimita la porzione inferiore della<br />
frontiera dell’insieme è data da y = 3x 2 mentre la porzione superiore della frontiera è<br />
y = x 2 + 2. L’integrale <strong>di</strong>venta<br />
∫∫<br />
D<br />
x 2 ydA =<br />
=<br />
=<br />
=<br />
∫ 1 ∫ x 2 +2<br />
−1<br />
∫ 1<br />
−1<br />
∫ 1<br />
−1<br />
∫ 1<br />
−1<br />
3x 2<br />
x 2 dydx<br />
[<br />
x 2 y ] y=x 2 +2<br />
y=3x 2<br />
x 2 (x 2 + 2 − 3x 2 )dx<br />
2x 2 − 2x 4 dx =<br />
] 1 [2 x3<br />
3 − 2x5 = 2 2 5<br />
−1<br />
3 − 22 5 = 8 15<br />
Esempio<br />
Es. 7.5.3 Sia da calcolare l’integrale ∫ 1 ∫ 1<br />
0 y sin x2 dxdy. Se cerchiamo <strong>di</strong> valutare l’integrale<br />
così come ci è stato presentato, abbiamo la <strong>di</strong>fficoltà <strong>di</strong> dover valutare ∫ sin x 2 dx.<br />
Si tratta, infatti, <strong>di</strong> uno <strong>di</strong> quegli integrali impossibili da valutare me<strong>di</strong>ante funzioni elementari!<br />
Ci conviene allora cambiare l’or<strong>di</strong>ne <strong>di</strong> integrazione. Cerchiamo allora <strong>di</strong> capire<br />
come { è fatto il dominio <strong>di</strong> integrazione } D. Da come è scritto l’integrale, risulta<br />
D = (x, y) ∈ R 2 : 0 ≤ y ≤ 1, y ≤ x ≤ 1 . Facciamo il grafico (si veda Figura 7.8). Questo<br />
dominio lo possiamo vedere come normale rispetto all’asse x prendendo 0 ≤ x ≤ 1 e<br />
0 ≤ y ≤ x.<br />
100
7.6. Proprietà <strong>degli</strong> integrali doppi<br />
Figura 7.7: Dominio <strong>di</strong> integrazione delimitato dalle parabole y = 3x 2 e y = x ∗ 2 + 2.<br />
Figura 7.8: Dominio <strong>di</strong> integrazione dell’integrale ∫ 1 ∫ 1<br />
0 y sin x2 dxdy.<br />
Quin<strong>di</strong><br />
∫ 1 ∫ 1<br />
0<br />
y<br />
∫∫<br />
sin x 2 dxdy =<br />
=<br />
=<br />
= 1 2<br />
D<br />
∫ 1 ∫ x<br />
0<br />
∫ 1<br />
sin x 2 dA<br />
0<br />
0<br />
∫ 1<br />
sin x 2 dydx =<br />
x sin x 2 dx = 1 2<br />
0<br />
∫ 1<br />
0<br />
∫ 1<br />
d(x 2 )<br />
dx sin x2 dx = 1 2<br />
0<br />
[<br />
y sin x<br />
2 ] y=x<br />
y=0 dx<br />
2x sin x 2 dx<br />
[<br />
− cos x<br />
2 ] 1<br />
0 = 1 (1 − cos 1)<br />
2<br />
7.6 Proprietà <strong>degli</strong> integrali doppi<br />
Assumendo che i seguenti integrali esistano, ve<strong>di</strong>amone brevemente alcune proprietà:<br />
G ∫∫ D (f(x, y) + g(x, y)) dA = ∫∫ D f(x, y)dA + ∫∫ D g(x, y)dA 101
7. INTEGRALI<br />
Figura 7.9: Esempio <strong>di</strong> trasformazione globalmente invertibile dall’insieme S del piano uv<br />
all’insieme R del piano xy.<br />
G ∫∫ D cf(x, y)dA = c ∫∫ f(x, y)dA, essendo c una costante.<br />
D<br />
G Se f(x, y) ≥ g(x, y) per tutti i punti (x, y) in D, allora ∫∫ D f(x, y)dA ≥ ∫∫ g(x, y)dA.<br />
D<br />
G Se D = D 1 ∪ D 2 , dove D 1 e D 2 sono domini che non si sovrappongono ma possono avere<br />
al più solo punti della frontiera in comune, allora<br />
∫∫<br />
f(x, y)dA =<br />
D<br />
∫∫<br />
f(x, y)dA +<br />
D 1<br />
∫∫<br />
f(x, y)dA<br />
D 2<br />
G Considerando la funzione <strong>di</strong> valore costante 1 si ha<br />
∫∫<br />
1dA = area(D)<br />
D<br />
dove area(D) è l’area dell’insieme D (torneremo su questo punto più avanti).<br />
G Se m ≤ f(x, y) ≤ M per tutti i punti (x, y) in D, allora<br />
∫∫<br />
m area(D) ≤ f(x, y)dA ≤ M area(D)<br />
7.7 Cambiamento <strong>di</strong> variabili<br />
D<br />
A volte, il calcolo <strong>di</strong> un integrale si può semplificare operando un cambiamento <strong>di</strong> variabili.<br />
A tale scopo, per il calcolo <strong>di</strong> integrali doppi, consideriamo un cambiamento <strong>di</strong><br />
variabili dato da una trasformazione T che permette <strong>di</strong> passare dal piano uv al piano xy:<br />
T (u, v) = (x, y) dove x e y sono legate a u e v me<strong>di</strong>ante equazioni del tipo<br />
x = x(u, v), y = y(u, v)<br />
Questa trasformazione può essere vista come una funzione vettoriale ⃗r = (x(u, v), y(u, v)).<br />
L’ipotesi fondamentale, allo scopo <strong>di</strong> calcolare un integrale doppio, è che la trasformazione<br />
ci permetta <strong>di</strong> ottenere tutti i punti del dominio <strong>di</strong> integrazione.<br />
Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono<br />
sottoinsiemi <strong>di</strong> R 2 . Se T (u 1 , v 1 ) = (x 1 , y 1 ) allora il punto (x 1 , y 1 ) è l’immagine del punto (u 1 , v 1 )<br />
me<strong>di</strong>ante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l’insieme<br />
<strong>di</strong> definizione e il codominio della trasformazione, allora si può definire la trasformazione<br />
inversa T −1 e si <strong>di</strong>ce che la trasformazione è globalmente invertibile (si veda Figura 7.9).<br />
Definizione 7.7.1 Una trasformazione x = x(u, v) y = y(u, v) definita in un insieme aperto <strong>di</strong><br />
R 2 si <strong>di</strong>ce regolare se<br />
1. è <strong>di</strong> classe C 1<br />
2. è globalmente invertibile<br />
102
7.7. Cambiamento <strong>di</strong> variabili<br />
Figura 7.10: Trasformazione dell’elemento S nel piano uv nell’elemento R nel piano xy.<br />
3. in ogni punto (u, v) lo jacobiano risulta <strong>di</strong>verso da zero 2<br />
∣ ∣∣∣∣∣∣∣∣ ∂x<br />
∂(x, y)<br />
∣∂(u, v) ∣ = ∂u<br />
∂y<br />
∂u<br />
∂x<br />
∂v<br />
= ∂x ∂y<br />
∂y<br />
∂u ∂v − ∂y ∂x<br />
∂u ∂v ≠ 0<br />
∣<br />
∂v<br />
Un esempio <strong>di</strong> trasformazione regolare è dato dalle coor<strong>di</strong>nate polari<br />
x = x(ρ, θ) = ρ cos (θ) y = y(ρ, θ) = ρ sin (θ) con ρ > 0 e 0 ≤ θ ≤ 2π.<br />
Cerchiamo <strong>di</strong> capire, ora, come un cambiamento <strong>di</strong> variabili agisca sul calcolo <strong>di</strong> un<br />
integrale doppio. Ricor<strong>di</strong>amo che, nel caso <strong>di</strong> un integrale <strong>di</strong> una funzione scalare il cambiamento<br />
<strong>di</strong> variabile porta alla tecnica della sostituzione: data una funzione f(x) da integrare<br />
in [a, b] si ha<br />
∫ b<br />
a<br />
f(x)dx =<br />
∫ d<br />
c<br />
f(g(u))g ′ (u)du<br />
dove x = g(u), a = g(c), b = g(d). Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, cosa si fa e per quale<br />
motivo<br />
7.7.1 Significato dello jacobiano<br />
Consideriamo un rettangolino S nel piano uv il cui angolo in basso a sinistra è dato dal<br />
punto (u 0 , v 0 ), e <strong>di</strong> <strong>di</strong>mensioni ∆u e ∆v. L’immagine della regione S attraverso la trasformazione<br />
regolare T sia la regione R del piano xy. Uno dei punti della frontiera sia proprio<br />
l’immagine del punto (u 0 , v 0 ), cioè (x 0 , y 0 ) = T (u 0 , v 0 ). Si veda la Figura 7.10.<br />
La trasformazione T sia data me<strong>di</strong>ante due equazioni parametriche del tipo x = x(u, v) e<br />
y = y(u, v) che possiamo vedere come una funzione vettoriale ⃗r(u, v) = (x(u, v), y(u, v)). Il lato<br />
del rettangolino <strong>di</strong> S che si ha per v = v 0 viene trasformato in R me<strong>di</strong>ante la curva ⃗r(u, v 0 )<br />
(che <strong>di</strong>pende ora solo dal parametro u). Di questa curva il vettore tangente in u = u 0 (quin<strong>di</strong><br />
al punto (x 0 , y 0 )) è dato da ⃗r tu = ( ∂x(u 0, v 0 )<br />
, ∂y(u 0, v 0 )<br />
).<br />
∂u ∂u<br />
Alla stessa maniera, troviamo che il vettore tangente alla curva ⃗r(u 0 , v) nel punto v = v 0 è<br />
dato da ⃗r tv = ( ∂x(u 0, v 0 )<br />
, ∂y(u 0, v 0 )<br />
).<br />
∂v ∂v<br />
2 Si rimanda alla definizione 4.7.1 per ricordare cosa è lo jacobiano.<br />
103
7. INTEGRALI<br />
Figura 7.11: Approssimazione <strong>di</strong> R me<strong>di</strong>ante i vettori secanti.<br />
La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti<br />
(si veda Figura 7.11) dati da<br />
⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 )<br />
Ricordando che ∂⃗r(u 0, v 0 )<br />
⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 )<br />
= lim ∆u→0 , e ricordando che la derivata<br />
∂u<br />
∆u<br />
parziale <strong>di</strong> una funzione vettoriale è data dalle derivate parziali delle singole componenti<br />
della funzione vettoriale, ricaviamo l’approssimazione<br />
⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u ∂⃗r<br />
∂u<br />
ma, per quanto detto prima, ∂⃗r<br />
∂u = ⃗r tu, da cui<br />
⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u⃗r tu .<br />
Con analogo ragionamento arriviamo all’approssimazione<br />
⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 ) ≈ ∆v⃗r tv .<br />
Quin<strong>di</strong> l’area della regione R può essere approssimata attraverso dall’area del parallelogramma<br />
<strong>di</strong> lati ⃗a e ⃗ b cioè ∆u⃗r tu e ∆v⃗r tv . L’area del parallelogramma determinato da due vettori<br />
è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quin<strong>di</strong> l’area <strong>di</strong> R si può<br />
approssimare tramite |(∆u⃗r tu ) × (∆v⃗r tv )|. Si ha, quin<strong>di</strong>,<br />
area(R) ≈ |⃗a × ⃗ b| = |(∆u⃗r tu ) × (∆v⃗r tv )| = |⃗r tu × ⃗r tv |∆u∆v<br />
Calcoliamo il prodotto vettoriale<br />
⃗i ⃗j ⃗ k<br />
∂x ∂y<br />
⃗r tu × ⃗r tv =<br />
∂u ∂u 0<br />
∂x ∂y<br />
∣ 0∣<br />
∂v ∂v<br />
I sottodeterminanti delle componenti rispetto a x e a y sono nulli, da cui<br />
∂x ∂y<br />
⃗r tu × ⃗r tv = ⃗ ∂u ∂u<br />
k<br />
= ∂x ∂y<br />
⃗ k( ∂x ∂y<br />
∂u ∂v − ∂x ∂y<br />
∂v ∂u )<br />
∣ ∣<br />
∂v ∂v<br />
104
7.7. Cambiamento <strong>di</strong> variabili<br />
Figura 7.12: Cambio <strong>di</strong> variabili per il calcolo <strong>di</strong> integrali doppi: trasformazione della regione<br />
S nella regione R me<strong>di</strong>ante la trasformazione regolare T .<br />
Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v:<br />
∂(x, y)<br />
∣∂(u, v) ∣ . Perciò, area(R) ≈<br />
∂(x, y)<br />
∣∂(u, v) ∣ ∆u∆v.<br />
∫∫ Supponiamo, ora, <strong>di</strong> dover calcolare l’integrale <strong>di</strong> una funzione f(x, y) su un dominio R<br />
f(x, y)dA. Sia data una trasformazione regolare che trasforma un insieme S del piano uv<br />
R<br />
nella regione R. Sud<strong>di</strong>vi<strong>di</strong>amo il dominio R in elementini R ij , ciascuno dei quali è immagine<br />
<strong>di</strong> un rettangolino S ij <strong>di</strong> S. Su ciascuno <strong>di</strong> questi elementini R ij consideriamo un punto <strong>di</strong><br />
coor<strong>di</strong>nate (x i , y j ) che è immagine, me<strong>di</strong>ante la trasformazione T , del punto (u i , v j ) che si<br />
trova sull’angolo in basso a sinistra del rettangolino S ij (si veda la Figura 7.12). Allora l’area<br />
∆R ij può essere approssimata me<strong>di</strong>ante la relazione<br />
∆R ij ≈<br />
∂(x, y)<br />
∣∂(u, v) ∣ ∆u∆v<br />
dove ∆u e ∆v sono i lati del rettangolino S ij , mentre lo jacobiano è valutato in (u i , v j ). Allora<br />
∫∫<br />
m∑ n∑<br />
f(x, y)dA ≈ f(x i , y j )∆R ij<br />
R<br />
≈<br />
i=1 j=1<br />
m∑<br />
i=1 j=1<br />
n∑<br />
f(x(u i , v j ), y(u i , v j ))<br />
∂(x, y)<br />
∣∂(u, v) ∣ ∆u∆v<br />
A questo punto osserviamo che<br />
m∑ n∑<br />
∫∫<br />
f(x(u i , v j ), y(u i , v j ))<br />
∂(x, y)<br />
∣∂(u, v) ∣ ∆u∆v ≈<br />
i=1 j=1<br />
S<br />
f(x(u, v), y(u, v)<br />
∂(x, y)<br />
∣∂(u, v) ∣ dudv<br />
Si arriva perciò al seguente teorema (che non <strong>di</strong>mostriamo, però tutti i <strong>di</strong>scorsi appena<br />
fatti ci portano a intuire che il risultato non può che essere così!).<br />
Teorema 7.7.1 Sia data una trasformazione regolare T della regione S del piano uv alla regione<br />
R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le<br />
regioni R e S siano domini normali rispetto all’asse x o y. Allora<br />
∫∫<br />
∫∫<br />
f(x, y)dA = f(x(u, v), y(u, v)<br />
∂(x, y)<br />
∣<br />
∣∂(u, v)<br />
R<br />
S<br />
∣ dudv 105
7. INTEGRALI<br />
Figura 7.13: Aree corrispondenti nel piano θρ e nel piano xy.<br />
Figura 7.14: Insiemi S e R per il calcolo dell’integrale ∫∫ 4x + 8ydA.<br />
R<br />
Esempio<br />
Es. 7.7.1 Consideriamo il caso della trasformazione data dalle coor<strong>di</strong>nate polari, per cui<br />
x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ).<br />
Il rettangolino ∆θ∆ρ viene trasformato in una specie <strong>di</strong> rettangolino con i lati curvi.<br />
Il <strong>di</strong>segno mostrato in figura 7.13 è stato realizzato facendo variare θ nell’intervallino<br />
[ 2π 3 , 2π + 0.5] e ρ in [0.5, 0.75].<br />
3<br />
Lo jacobiano <strong>di</strong> questa trasformazione è dato da<br />
∣ ∂(x, y)<br />
∣∣∣ ∣ ∂(ρ, θ) ∣ = cos (θ) −ρ sin (θ)<br />
sin (θ) ρ cos (θ) ∣ = ρ cos2 (θ) + ρ sin 2 (θ) = ρ<br />
Perciò, se facciamo un cambiamento <strong>di</strong> variabili utilizzando coor<strong>di</strong>nate polari si ha:<br />
∫∫<br />
∫∫<br />
f(x, y)dA = f(ρ cos (θ), ρ sin (θ))ρ dρdθ<br />
R<br />
S<br />
106
7.8. Area <strong>di</strong> un dominio<br />
Esempio<br />
Es. 7.7.2 Sia da calcolare ∫∫ 4x + 8ydA dove R è il parallelogramma <strong>di</strong> vertici A(−1, 3),<br />
R<br />
B(1, −3), C(3, −1) e D(1, 5). Si applichi la trasformazione x = 1 4 (u + v), y = 1 (v − 4u).<br />
4<br />
Il parallelogramma R è rappresentato in Figura 7.14. Se scriviamo le equazioni dei lati del<br />
parallelogramma si trova facilmente che la retta per AB è data dall’equazione y + 3x = 0,<br />
la retta per CD è data da y + 3x = 8, la retta per BC è x − y = 4 e infine quella per AD è<br />
x − y = −4.<br />
Da queste relazioni, si vede che ponendo u = x−y e v = y +3x, si ricava la trasformazione<br />
assegnata x = 1 4 (u + v), y = 1 (v − 4u). Inoltre si vede che R è l’immagine del rettangolo S<br />
4<br />
delimitato dalle linee u = 4, u = −4, v = 0 e v = 8.<br />
Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo<br />
Allora<br />
∫∫<br />
∣ ∣∣∣∣∣∣∣ 1<br />
∂(x, y)<br />
∣∂(u, v) ∣ = 4<br />
1<br />
4<br />
R<br />
−3<br />
4<br />
1<br />
4<br />
∫∫<br />
4x + 8ydA =<br />
= 1 4<br />
= 1 4<br />
= 1 4<br />
∣<br />
(4 1 4 (u + v) + 81 4 (v − 3u) ) 1<br />
4 dudv = ∫∫<br />
S<br />
∫ 4 ∫ 8<br />
−4<br />
∫ 4<br />
0<br />
(3v − 5u)dvdu = 1 4<br />
−4(96 − 40u)du = 1 4<br />
∫ 4<br />
−4<br />
S<br />
[ 3<br />
2 v2 − 5uv] v=8<br />
[<br />
96u − 20u<br />
2 ] u=4<br />
u=−4 = 192<br />
(u + v + 2v − 6u) 1 4 dudv<br />
du<br />
v=0<br />
7.8 Area <strong>di</strong> un dominio<br />
Dagli integrali doppi si può ricavare un’altra considerazione geometrica, sull’area del<br />
dominio <strong>di</strong> integrazione. Come abbiamo già visto tra le proprietà <strong>degli</strong> integrali doppi, si ha<br />
∫∫<br />
area(D) = dA<br />
D<br />
Proviamo a <strong>di</strong>mostrare questo risultato, supponendo che D sia un dominio normale rispetto<br />
all’asse x, da cui a ≤ x ≤ b e g 1 (x) ≤ y ≤ g 2 (y). L’area compresa tra le curve g 2 (x) e<br />
g 1 (x), vale a <strong>di</strong>re l’area <strong>di</strong> D, può essere calcolata proprio come la <strong>di</strong>fferenze <strong>degli</strong> integrali<br />
delle due funzioni, tramite l’integrale<br />
area(D) =<br />
∫ b<br />
a<br />
(g 2 (x) − g 1 (x))dx<br />
D’altra parte, dalla definizione <strong>di</strong> integrale doppio, considerando la funzione f(x, y) = 1,<br />
107
7. INTEGRALI<br />
Figura 7.15: Area <strong>di</strong> D come integrale doppio<br />
abbiamo<br />
∫∫<br />
D<br />
dxdy =<br />
=<br />
∫ b ∫ g2(x)<br />
a<br />
∫ b<br />
a<br />
(<br />
g 1(x)<br />
dy)dx<br />
(g 2 (x) − g 1 (x))dx<br />
e, per quanto abbiamo appena visto<br />
= area(D)<br />
7.9 Cenni su integrali tripli<br />
L’estensione del concetto <strong>di</strong> integrale <strong>di</strong> una funzione <strong>di</strong>pendente da due variabili ad una<br />
funzione <strong>di</strong>pendente da tre variabili porta al cosiddetto integrale triplo: ∫∫∫ f(x, y, z)dV .<br />
E<br />
Il caso più semplice si ha quando il dominio <strong>di</strong> integrazione E è rappresentato da un<br />
parallelepipedo [a, b] × [c, d] × [r, s].<br />
Allora si ha:<br />
∫∫∫<br />
∫ s ∫ d ∫ b<br />
f(x, y, z)dV =<br />
f(x, y, z)dxdydz<br />
E<br />
=<br />
=<br />
= .<br />
r c a<br />
∫ b ∫ d ∫ s<br />
a c r<br />
∫ d ∫ s ∫ b<br />
c<br />
r<br />
a<br />
f(x, y, z)dzdydx<br />
f(x, y, z)dxdzdy<br />
Abbiamo 6 <strong>di</strong>verse possibilità <strong>di</strong> integrazione, prima rispetto a x, poi rispetto a y, poi rispetto<br />
a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando<br />
l’or<strong>di</strong>ne delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l’integrale <strong>di</strong><br />
funzioni continue, in modo da estendere il teorema <strong>di</strong> Fubini).<br />
108
7.10. Integrali curvilinei<br />
Si ha, inoltre, che il volume <strong>di</strong> una regione tri<strong>di</strong>mensionale E è dato da un integrale triplo<br />
e, precisamente<br />
∫∫∫<br />
volume(E) = dV<br />
E<br />
Se la regione <strong>di</strong> integrazione E è più generale, le tecniche <strong>di</strong> integrazione sono estese su<br />
tre possibili tipi <strong>di</strong> dominio:<br />
1. Primo caso: E = {(x, y, z) t.c. (x, y) ∈ D, u 1 (x, y) ≤ z ≤ u 2 (x, y)}, dove D è un regione nel<br />
piano xy (che a sua volta può essere visto come un dominio normale rispetto all’asse x o<br />
rispetto all’asse y). La regione E viene detta normale rispetto al piano xy e l’integrazione<br />
per fili.<br />
∫∫∫<br />
∫∫ [ ∫ ]<br />
u2(x,y)<br />
f(x, y, z)dV =<br />
f(x, y, z)dz dA<br />
E<br />
D<br />
u 1(x,y)<br />
2. Secondo caso: E = {(x, y, z) t.c. (y, z) ∈ D, u 1 (y, z) ≤ x ≤ u 2 (y, z)}, dove D è un regione<br />
nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />
y o rispetto all’asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce<br />
a vedere l’insieme D come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione per<br />
strati o per sezione.<br />
∫∫∫<br />
∫∫ [ ∫ ]<br />
u2(y,z)<br />
f(x, y, z)dV =<br />
f(x, y, z)dx dA<br />
E<br />
D<br />
u 1(y,z)<br />
3. Secondo caso: E = {(x, y, z) t.c. (x, z) ∈ D, u 1 (x, z) ≤ y ≤ u 2 (x, z)}, dove D è un regione<br />
nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />
x o rispetto all’asse z). La regione E viene detta normale rispetto al piano xz. Se l’insieme<br />
D lo si può vedere come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione<br />
per strati o per sezione.<br />
∫∫∫<br />
∫∫ [ ∫ ]<br />
u2(x,z)<br />
f(x, y, z)dV =<br />
f(x, y, z)dy dA<br />
E<br />
7.10 Integrali curvilinei<br />
D<br />
u 1(x,z)<br />
Un integrale curvilineo (o <strong>di</strong> linea) ha lo scopo <strong>di</strong> integrare una funzione <strong>di</strong> due (o tre)<br />
variabili su un insieme <strong>di</strong> integrazione dato da una curva γ.<br />
Ci soffermiamo al caso bi<strong>di</strong>mensionale (quin<strong>di</strong> funzioni <strong>di</strong> due variabili e curve nel piano<br />
xy).<br />
Consideriamo una curva γ regolare (la funzione vettoriale f che la rappresenta è continua<br />
e la sua derivata è <strong>di</strong>versa da zero per ogni valore del parametro t.) Quin<strong>di</strong> f(t) = (x(t), y(t))<br />
con a ≤ t ≤ b.<br />
∫ L’integrale curvilineo <strong>di</strong> una funzione g(x, y) lungo la curva γ si denota con il simbolo<br />
g(x, y)ds dove ds rappresenta il <strong>di</strong>fferenziale dell’ascissa curvilinea, dovuto al fatto che ci<br />
γ<br />
stiamo muovendo lungo la curva e<br />
√<br />
non su l’asse delle x o delle y.<br />
(dx ) 2 ( ) 2 dy<br />
Ricor<strong>di</strong>amo che ds = |f ′ (t)|dt = + dt<br />
dt dt<br />
Allora, andando a sostituire nell’integrale curvilineo e considerando la curva scritta in<br />
forma parametrica si ha:<br />
√<br />
∫<br />
∫ b<br />
(dx ) 2 ( ) 2 dy<br />
g(x, y)ds = g(x(t), y(t)) + dt<br />
dt dt<br />
γ<br />
a<br />
109
7. INTEGRALI<br />
Per g(x, y) = 1 si ottiene la lunghezza della curva.<br />
Esempio<br />
Es. 7.10.1 Vogliamo calcolare ∫ γ (4+xy2 )ds dove γ è la porzione <strong>di</strong> circonferenza <strong>di</strong> centro<br />
nell’origine e raggio unitario che si ha −1 ≤ x ≤ 0.<br />
Scriviamo le equazioni parametriche della curva γ:<br />
x = cos t, y = sin t,<br />
L’integrale da calcolare <strong>di</strong>venta<br />
∫<br />
γ<br />
(4 + xy 3 )ds =<br />
=<br />
∫ 3π/2<br />
π/2<br />
∫ 3π/2<br />
π/2<br />
π<br />
2 ≤ t ≤ 3 2 π<br />
√<br />
(4 + cos t sin 2 t) sin 2 t + cos 2 tdt<br />
(4 + D(sin t) sin 2 t)dt =<br />
[ ] 3π/2<br />
4t + sin3 t<br />
= 4π − 2 3<br />
π/2<br />
3<br />
Se la curva è regolare a tratti, l’integrale curvilineo si scrive come somma <strong>degli</strong> integrali<br />
curvilinei su ciascun tratto <strong>di</strong> curva regolare <strong>di</strong> cui è composta. In pratica se γ = γ 1 ∪γ 2 . . .∪γ n<br />
con n numero intero, allora<br />
∫<br />
g(x, y)ds =<br />
γ<br />
∫<br />
g(x, y)ds +<br />
γ 1<br />
∫<br />
g(x, y)ds + . . . +<br />
γ 2<br />
∫<br />
g(x, y)ds.<br />
γ n<br />
Ogni curva ha un suo orientamento.<br />
cambia l’integrale curvilineo<br />
Se cambiamo la <strong>di</strong>rezione <strong>di</strong> moto della curva,<br />
Proposizione 7.10.1 Se si cambia l’orientamento <strong>di</strong> una curva, passando dalla curva +γ alla<br />
curva −γ l’integrale curvilineo non cambia:<br />
∫<br />
∫<br />
g(x, y)ds = g(x, y)ds<br />
γ<br />
−γ<br />
Se +γ è data dalle equazioni parametriche (x(t), y(t)) con a ≤ t ≤ b, (primo punto A =<br />
(x(a), y(a)), ultimo punto B = (x(b), y(b))), la curva −γ ha equazioni (x(−t), y(−t)) con t che<br />
varia in [−b, −a], (primo punto (x(b), y(b)) = B, ultimo punto (x(a), y(a)) = A). Le curve sono le<br />
stesse a parte l’orientamento, ma questo non influisce sul risultato dell’integrale curvilineo.<br />
7.11 Integrali <strong>di</strong> superficie<br />
Cerchiamo ora <strong>di</strong> integrare una funzione su una superficie S nello spazio tri<strong>di</strong>mensionale.<br />
7.11.1 Area <strong>di</strong> una superficie<br />
Per capire le formule che scriveremo nel seguito, deriviamo la formula che permette<br />
<strong>di</strong> calcolare l’area <strong>di</strong> una superficie data da equazioni parametriche x = x(u, v), y =<br />
y(u, v), z = z(u, v), equazioni che possiamo scrivere tramite la funzione vettoriale ⃗r(u, v) =<br />
(x(u, v), y(u, v), z(u, v)).<br />
Con un <strong>di</strong>scorso del tutto simile a quanto abbiamo visto nella sezione 7.7 sul cambiamento<br />
<strong>di</strong> variabile, chiamando però adesso D come l’insieme in cui varia (u, v) e S la superficie parametrica,<br />
sud<strong>di</strong>videndo D in rettangolini D ij , in S si hanno i corrispondenti elementini S ij .<br />
Inoltre, se (u i , v j ) è il vertice in basso a sinistra <strong>di</strong> D ij , il punto P ij (x(u i , v j ), y(u i , v j ), z(u i , v j ))<br />
è il corrispondente punto su S ij . L’area dell’elementino S ij può essere approssimata me<strong>di</strong>ante<br />
il parallelogramma <strong>di</strong> lati ∆u⃗r u (u i , v j ) e ∆v⃗r v (u i , v j ) dove ⃗r u e ⃗r v rappresentano la<br />
110
7.11. Integrali <strong>di</strong> superficie<br />
derivata <strong>di</strong> ⃗r rispetto alle variabili u e v, rispettivamente. Il <strong>di</strong>scorso da fare è del tutto analogo<br />
a quanto abbiamo visto nella sezione 7.7. L’area del parallelogramma, che approssima<br />
l’area dell’elementino, è dunque uguale al modulo del prodotto vettoriale <strong>di</strong> ∆u⃗r u (u i , v j ) e<br />
∆v⃗r v (u i , v j ).<br />
L’area della superficie sarà dunque data dalla somma <strong>di</strong> tutte queste aree, facendo tendere<br />
a infinito il numero <strong>degli</strong> elementini in cui sud<strong>di</strong>vi<strong>di</strong>amo la superficie. Si ha infatti la<br />
definizione<br />
Definizione 7.11.1 Data una superficie S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), con<br />
(u, v) ∈ D, allora l’area della superficie è data da<br />
∫∫<br />
area(S) = |⃗r u × ⃗r v |dA<br />
D<br />
dove ⃗r u = ( ∂x<br />
∂u , ∂y<br />
∂u , ∂z<br />
∂u ) e ⃗r v = ( ∂x<br />
∂v , ∂y<br />
∂v , ∂z<br />
∂v ).<br />
Nel caso in cui la superficie è data da una funzione z = f(x, y), possiamo ricondurci al<br />
caso precedente considerando ⃗r(u, v) = ⃗r(x, y) = (x, y, f(x, y)).<br />
In tal caso<br />
∣<br />
⃗i ⃗j ⃗ k<br />
∣<br />
1 0<br />
⃗r u × ⃗r v =<br />
∣0 1<br />
∂f<br />
∂x<br />
∂f<br />
∣<br />
∂y<br />
√ (∂f ) 2<br />
Perciò |⃗r u × ⃗r v | = +<br />
∂x<br />
∫∫<br />
A(S) =<br />
D<br />
√ (∂f ) 2<br />
+<br />
∂x<br />
= (− ∂f<br />
∂x , −∂f ∂y , 1)<br />
( ) 2 ∂f<br />
+ 1 e l’area della superficie è<br />
∂y<br />
( ) 2 ∂f<br />
+ 1dA<br />
∂y<br />
7.11.2 Integrale <strong>di</strong> una superficie<br />
Siamo ora in grado <strong>di</strong> capire la formula da applicare nel caso in cui bisogna calcolare<br />
l’integrale <strong>di</strong> una funzione g su una superficie S.<br />
L’area dell’elementino dS si riconduce alla formula dell’area <strong>di</strong> una superficie che abbiamo<br />
appena visto. Perciò, se la superficie S è data me<strong>di</strong>ante una funzione z = f(x, y), con (x, y) ∈<br />
D ⊂ R 2 , l’integrale <strong>di</strong> superficie <strong>di</strong> una funzione g(x, y, z) sulla superficie S è dato da<br />
∫∫<br />
S<br />
∫∫<br />
g(x, y, z)dS =<br />
D<br />
√ (∂f ) 2<br />
g(x, y, f(x, y)) +<br />
∂x<br />
( ) 2 ∂f<br />
+ 1dA<br />
∂y<br />
Dobbiamo prestare molta attenzione a questo tipo <strong>di</strong> integrali perchè l’integrale a destra è<br />
un integrale doppio mentre l’integrale a sinistra è un integrale <strong>di</strong> superficie. Quin<strong>di</strong> il calcolo<br />
<strong>di</strong> un integrale <strong>di</strong> superficie si riconduce ad un integrale doppio.<br />
La superficie potrebbe essere scritta come y = f(x, z) o x = f(y, z). La definizione <strong>di</strong><br />
integrale <strong>di</strong> superficie è analoga (con le dovute sostituzioni) a quella appena scritta.<br />
Se la superficie, invece, è scritta in forma parametrica :<br />
x = x(u, v) y = y(u, v) z = z(u, v) (u, v) ∈ I<br />
111
7. INTEGRALI<br />
allora si ha<br />
∫∫<br />
∫∫<br />
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />
S<br />
I<br />
dove |⃗r u ×⃗r v | rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando<br />
parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo<br />
da poter avere l’area dell’elementino <strong>di</strong> superficie dS.<br />
Quin<strong>di</strong><br />
⃗i ⃗j ⃗ k<br />
∂y ∂z<br />
∂x ∂z<br />
∂x ∂y<br />
∂x ∂y ∂z<br />
∂u ∂u<br />
∂u ∂u<br />
⃗n = ⃗r u × ⃗r v =<br />
∂u ∂u ∂u<br />
=⃗i<br />
− ⃗j<br />
+ ∂y ∂z<br />
∂x ∂z<br />
⃗ ∂u ∂u<br />
k<br />
∂x ∂y<br />
∣ ∣ ∣ ∣ ∣ ∣<br />
∂x ∂y ∂z<br />
∂v ∂v ∂v ∂v ∂v ∂v<br />
∣<br />
∣<br />
∂v ∂v ∂v<br />
scambiamo le colonne del sottodeterminante relativo a ⃗j<br />
∂y ∂z<br />
∂z ∂x<br />
∂x ∂y<br />
∂u ∂u<br />
∂u ∂u<br />
=⃗i<br />
+ ⃗j<br />
+ ∂y ∂z<br />
∂z ∂x<br />
⃗ ∂u ∂u<br />
k<br />
∂x ∂y<br />
∣ ∣ ∣ ∣ ∣ ∣<br />
∂v ∂v ∂v ∂v ∂v ∂v<br />
osserviamo che i sottodeterminanti sono <strong>degli</strong> jacobiani<br />
=⃗i<br />
∂(y, z)<br />
∣∂(u, v) ∣ + ⃗j<br />
∂(z, x)<br />
∣∂(u, v) ∣ + ⃗ k<br />
∂(x, y)<br />
∣∂(u, v) ∣<br />
Chiamando con n 1 , n 2 e n 3 le componenti del vettore normale appena ottenuto, n 1 =<br />
∂(y, z)<br />
∣∂(u, v) ∣ , n 2 =<br />
∂(z, x)<br />
∣∂(u, v) ∣ e n 3 =<br />
∂(x, y)<br />
∣∂(u, v) ∣ , il modulo <strong>di</strong> ⃗n è dato da |⃗n| = √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 .<br />
Quin<strong>di</strong><br />
∫∫<br />
∫∫<br />
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />
S<br />
D<br />
∫∫<br />
= g(x(u, v), y(u, v), z(u, v)) √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 dA<br />
D<br />
Se g(x, y, z) = 1 l’integrale <strong>di</strong> superficie ci fa ritrovare l’area della superficie.<br />
Esempio<br />
Es. 7.11.1 Calcoliamo l’integrale <strong>di</strong> superficie I = ∫∫ yzdS dove S è la superficie <strong>di</strong><br />
S<br />
equazioni parametriche x = u 2 , y = u sin (v), z = u cos (v), con 0 ≤ u ≤ 1 e 0 ≤ v ≤ π/2.<br />
L’integrale da calcolare <strong>di</strong>venta l’integrale doppio<br />
∫∫<br />
I =<br />
D<br />
u sin (v)u cos (v)|⃗r u × ⃗r v |dudv =<br />
∫ 1 ∫ π/2<br />
0<br />
0<br />
u 2 sin (v) cos (v)|⃗r u × ⃗r v |dvdu<br />
Calcoliamo il modulo del prodotto vettoriale. Abbiamo<br />
⃗i ⃗j ⃗ k<br />
⃗r u × ⃗r v =<br />
2u sin (v) cos (v)<br />
∣ 0 u cos (v) −u sin (v) ∣ = . . . = ⃗i(−u) + ⃗j(2u 2 sin (v)) + ⃗ k(2u 2 cos (v))<br />
112
7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />
Perciò, quando calcoliamo il modulo, abbiamo (consideriamo anche 0 ≤ u ≤ 1):<br />
√<br />
|⃗r u × ⃗r v | = u 2 + 4u 4 sin 2 (v) + 4u 4 cos 2 (v) = u √ 1 + 4u 2<br />
L’integrale è<br />
I =<br />
∫ 1 ∫ π/2<br />
0<br />
0<br />
u 2 sin (v) cos (v)u √ 1 + 4u 2 dvdu =<br />
∫ 1 ∫ π/2<br />
0<br />
0<br />
u 3√ 1 + 4u 2 sin (v) cos (v)dvdu<br />
Osserviamo che abbiamo funzioni che <strong>di</strong>pendono solo da v e funzioni che <strong>di</strong>pendono<br />
solo da u, perciò le funzioni che <strong>di</strong>pendono solo da u, le possiamo portare fuori<br />
dall’integrale in v, ricavando<br />
Ora<br />
I =<br />
∫ π/2<br />
0<br />
∫ 1<br />
0<br />
u 3√ ∫ π/2<br />
1 + 4u 2 sin (v) cos (v)dvdu<br />
0<br />
sin (v) cos (v)dv =<br />
∫ π/2<br />
0<br />
sin (v)D(sin (v))dv = sin2 (v)<br />
2<br />
Andando a sostituire nell’integrale doppio abbiamo<br />
I = 1 2<br />
∫ 1<br />
0<br />
u 3√ 1 + 4u 2 du<br />
Facciamo un cambiamento <strong>di</strong> variabili ponendo t = 1+4u 2 da cui u 2 = t − 1 e 2udu = dt<br />
4<br />
4 ,<br />
ovvero udu = dt . Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quin<strong>di</strong><br />
8<br />
I = 1 2<br />
= 1<br />
64<br />
= 1<br />
64<br />
∫ 1<br />
0<br />
∫ 5<br />
u 2√ 1 + 4u 2 udu = 1 2<br />
(t √ t − √ t)dt = 1<br />
1<br />
64<br />
2<br />
∣5 t5/2 − 2 ∣ ∣∣∣<br />
5<br />
3 t3/2<br />
1<br />
∫ 5<br />
1<br />
∫ 5<br />
1<br />
t − 1√ dt t<br />
4 8<br />
(t 3/2 − t 1/2 )dt<br />
= . . . = 5√ 5<br />
48 + 1<br />
240<br />
∣<br />
π/2<br />
0<br />
= 1 2<br />
7.12 Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />
Ve<strong>di</strong>amo da un punto <strong>di</strong> vista matematico i concetti <strong>di</strong> massa e baricentro (usualmente<br />
visti in fisica). Ci serviranno successivamente per calcolare il volume <strong>di</strong> un solido o l’area<br />
<strong>di</strong> una superficie ottenuti, rispettivamente, me<strong>di</strong>ante rotazione <strong>di</strong> una superficie o <strong>di</strong> una<br />
curva attorno ad uno <strong>degli</strong> assi.<br />
Ci limitiamo a vedere le definizioni <strong>di</strong> massa, momenti e baricentro, per il caso<br />
bi<strong>di</strong>mensionale.<br />
Definizione 7.12.1 Si definisce massa <strong>di</strong> un oggetto piano che riempe una regione C, con<br />
densità data da µ(x, y) (funzione continua), la quantià m data da<br />
∫∫<br />
m = µ(x, y)dxdy<br />
C<br />
113
7. INTEGRALI<br />
Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti<br />
sono dati da<br />
∫∫<br />
M x = yµ(x, y)dxdy<br />
C<br />
∫∫<br />
M y = xµ(x, y)dxdy<br />
C<br />
Il baricentro (o centro <strong>di</strong> massa) dell’oggetto è il punto (x, y) dato da (m essendo la massa)<br />
x = M ∫∫<br />
y<br />
m = C xµ(x, y)dxdy<br />
∫∫<br />
µ(x, y)dxdy<br />
C<br />
y = M ∫∫<br />
x<br />
m = C yµ(x, y)dxdy<br />
∫∫<br />
µ(x, y)dxdy<br />
C<br />
Nel caso <strong>di</strong> una curva piana γ, omogenea e con densità µ ≡ 1, si ha:<br />
G la massa m è data da<br />
∫<br />
m = ds =⇒ m = L (la lunghezza della curva)<br />
γ<br />
G i momenti sono<br />
∫<br />
∫<br />
M x = yds M y =<br />
G il baricentro ha coor<strong>di</strong>nate<br />
x = M y<br />
L<br />
= 1 ∫<br />
xds<br />
L<br />
γ<br />
γ<br />
γ<br />
xds<br />
y = M x<br />
L<br />
= 1 L<br />
∫<br />
γ<br />
Definiamo, a questo punto, il solido <strong>di</strong> rotazione.<br />
Sia D un insieme del piano (x, y), chiuso e limitato (e integrabile). Per semplicità i valori<br />
<strong>di</strong> y siano positivi.<br />
Una rotazione del piano (x, y) intorno all’asse x (o y) fa sì che l’insieme D generi un solido<br />
I nello spazio (x, y, z), che chiamiamo solido <strong>di</strong> rotazione.<br />
Per calcolare il volume <strong>di</strong> un solido <strong>di</strong> rotazione si ha il<br />
Teorema 7.12.1 (Primo teorema <strong>di</strong> Gul<strong>di</strong>no) Il volume dell’insieme I, solido <strong>di</strong> rotazione ottenuto<br />
dall’insieme D è uguale all’area <strong>di</strong> D per la lunghezza della circonferenza descritta nella<br />
rotazione dal baricentro <strong>di</strong> D.<br />
Supponendo che la rotazione sia fatta attorno all’asse x, il raggio della circonferenza descritta<br />
dal baricentro è data dall’or<strong>di</strong>nata del baricentro (si considera µ ≡ 1). Quin<strong>di</strong><br />
yds<br />
volume(I) = area(D) × lunghezza della circonferenza<br />
volume(I) = area(D) × 2π raggio della circonferenza<br />
volume(I) = area(D)2π y<br />
∫∫<br />
D<br />
volume(I) = area(D)2π ∫∫<br />
ydxdy<br />
D<br />
∫∫<br />
dxdy<br />
D<br />
volume(I) = area(D)2π<br />
ydxdy<br />
area(D)<br />
∫∫<br />
= 2π ydxdy<br />
D<br />
114
7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />
Figura 7.16: Insieme D da cui calcolare il volume del solido <strong>di</strong> rotazione attorno all’asse x.<br />
Se la rotazione <strong>di</strong> D avviene attorno all’asse y, il volume del solido <strong>di</strong> rotazione è data da<br />
∫∫<br />
volume(I) = 2π xdxdy<br />
D<br />
perchè la circonferenza descritta dal baricentro ha raggio dato da x.<br />
Definiamo, ora, la superficie <strong>di</strong> rotazione.<br />
Sia γ una curva generalmente regolare del piano (x, y). Sia y > 0. Consideriamo l’asse<br />
z ortogonale in (0, 0) al piano (x, y). Una rotazione del piano (x, y) intorno all’asse x (o y) fa<br />
sì che la curva γ generi una superficie S nello spazio (x, y, z), che chiamiamo superficie <strong>di</strong><br />
rotazione.<br />
Per misurare l’area <strong>di</strong> una superficie <strong>di</strong> rotazione si ha il<br />
Teorema 7.12.2 (Secondo teorema <strong>di</strong> Gul<strong>di</strong>no) L’area della superficie <strong>di</strong> rotazione S generata<br />
dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza<br />
descritta nella rotazione dal baricentro <strong>di</strong> γ.<br />
Sia γ data da equazioni parametriche x = x(t), y = y(t) con t ∈ [a, b] e <strong>di</strong> lunghezza L.<br />
La superficie sia ottenuta me<strong>di</strong>ante rotazione attorno all’asse x. Allora la circonferenza ha<br />
raggio y con y = 1 ∫<br />
L<br />
γ yds = 1 ∫ b<br />
L<br />
a y(t)√ (x ′ (t)) 2 + (y ′ (t)) 2 dt. Allora<br />
area(S) = lunghezza della curva × lunghezza della circonferenza<br />
area(S) = L2π y<br />
area(S) = L2π 1 L<br />
area(S) = 2π<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />
y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />
Se la rotazione avviene attorno all’asse y invece si ha<br />
area(S) = 2π<br />
∫ b<br />
a<br />
x(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />
115
7. INTEGRALI<br />
Esempio<br />
Es. 7.12.1 Calcoliamo il volume del solido <strong>di</strong> rotazione ottenuto dalla rotazione completa<br />
attorno all’asse x dell’insieme<br />
{<br />
D = (x, y) ∈ R 2 : x 2 + y 2 ≤ 3 }<br />
4 , x2 ≥ y, y ≥ 0, x ≥ 0<br />
Per calcolare questo integrale dobbiamo applicare il primo teorema <strong>di</strong> Gul<strong>di</strong>no. Il volume<br />
richiesto sarà dato da<br />
∫∫<br />
V = 2π ydxdy<br />
D<br />
L’insieme D è dato dalla regione compresa al <strong>di</strong> sotto della parabola y = x 2 e all’interno<br />
della circonferenza con centro nell’origine e raggio r = √ 3/2, che si trova nel primo<br />
quadrante (si veda Figura 7.16).<br />
Cerchiamo i punti <strong>di</strong> intersezione tra la parabola e la circonferenza risolvendo il sistema<br />
⎧<br />
⎨y = x 2<br />
⎩x 2 + y 2 = 3 4<br />
Sostituendo y = x 2 nella seconda equazione si ha x 2 + x 4 = 3 . Con la sostituzione<br />
4<br />
t = x 2 l’equazione <strong>di</strong>venta t 2 + t − 3 4 = 0 da cui t = −1 ± √ 1 + 3<br />
= −1 ± 2 : quin<strong>di</strong><br />
2<br />
2<br />
le due ra<strong>di</strong>ci sono t = 1 2 e t = −3 2 . Ritornando a x2 = t, si ha come soluzione del<br />
primo quadrante il punto x = √ 1 e y = 1 . Per calcolare l’integrale, possiamo vedere il<br />
2 2<br />
dominio <strong>di</strong> integrazione come normale rispetto all’asse x, considerando l’unione <strong>di</strong> due<br />
insiemi, il primo dato da 0 ≤ x ≤ √ 1 , e 0 ≤ y ≤ x 2 , e il secondo dato da √ 1 ≤ x ≤ 3 2 2 2 e<br />
0 ≤ y ≤<br />
√<br />
3<br />
4 − x2 .<br />
Quin<strong>di</strong> l’integrale da calcolare va spezzato in due integrali su questi domini. Oppure,<br />
si può vedere il dominio <strong>di</strong> integrazione normale rispetto all’asse y, con 0 ≤ y ≤ 1 2 e<br />
√ y ≤ x ≤<br />
√<br />
3<br />
4 − y2 .<br />
In tal caso l’integrale <strong>di</strong>venta<br />
Si ha<br />
V =<br />
V =<br />
∫ 1/2<br />
0<br />
∫ 1/2<br />
0<br />
= − 1 2<br />
∫ √ 3<br />
4 −y2<br />
√ y<br />
ydxdy<br />
y(√<br />
3<br />
4 − y2 − √ y)dy =<br />
∫ 1/2<br />
0<br />
(−2y)√<br />
3<br />
4 − y2 dy −<br />
∫ 1/2<br />
0<br />
∫ 1/2<br />
0<br />
y√<br />
3<br />
4 − y2 dy −<br />
y 3/2 dy = − 1 2<br />
∫ 1/2<br />
0<br />
∫ 1/2<br />
0<br />
y √ ydy<br />
D( 3 4 − y2 )<br />
√<br />
3<br />
4 − y2 dy − 2 5 y5/2 ∣ ∣∣∣<br />
1/2<br />
0<br />
116
7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />
= − 1 2<br />
Esempio<br />
∣<br />
2<br />
∣∣∣<br />
1/2<br />
3 (3 4 − y2 ) 3/2<br />
0<br />
− 1<br />
10 √ 2 = −1 3 (1 2 )3/2 + 1 3 (3 4 )3/2 − 1<br />
10 √ 2<br />
= − 1<br />
√<br />
3<br />
6 √ 2 + 8 − 1<br />
10 √ 2 = − 4<br />
√ √ √<br />
3 2 3<br />
14 √ 2 + 8 = − 7 + 8<br />
Es. 7.12.2 L’arco <strong>di</strong> parabola y = x 2 per 1 ≤ x ≤ 2 è ruotato attorno all’asse y. Vogliamo<br />
trovare l’area della superficie <strong>di</strong> rotazione. In questo caso dobbiamo applicare il secondo<br />
teorema <strong>di</strong> Gul<strong>di</strong>no, vedendo la parabola come la curva <strong>di</strong> coor<strong>di</strong>nate parametriche x = x,<br />
y = x 2 , per cui<br />
Quin<strong>di</strong><br />
area(S) = 2π<br />
∫ 2<br />
1<br />
∫ 2<br />
area(S) = 2π<br />
1<br />
x √ 1 + 4x 2 dx.<br />
8x<br />
8<br />
= 1 4 π 2(1 + 4x2 ) 3/2<br />
3<br />
√<br />
1 + 4x2 dx = 1 ∫ 2<br />
4 π D(1 + 4x 2 ) √ 1 + 4x 2 dx<br />
∣<br />
= 1 6 π(17√ 17 − 5 √ 5)<br />
2<br />
1<br />
= 1 6 π(173/2 − 5 3/2 )<br />
1<br />
117
CAPITOLO 8<br />
Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie<br />
L’ignoranza per la matematica<br />
viene considerato un fatto<br />
positivo, a un certo livello della<br />
classe sociale. Eppure la<br />
matematica ha determinato la<br />
<strong>di</strong>rezione e il contenuto <strong>di</strong><br />
buona parte del pensiero<br />
filosofico, ha <strong>di</strong>strutto e<br />
ricostruito dottrine religiose,<br />
ha costituito il nerbo <strong>di</strong> teorie<br />
economiche e sociali, ha<br />
plasmato i principali stili<br />
pittorici, musicali,<br />
architettonici e letterari.<br />
Morris Kline (1908-1992)<br />
8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />
8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />
8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . . 122<br />
8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />
8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . . 123<br />
8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />
8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . 126<br />
8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />
8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />
8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />
8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />
8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . . 132<br />
8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />
8.1 Cosa è un’equazione <strong>di</strong>fferenziale<br />
Un’equazione <strong>di</strong>fferenziale è un’equazione che coinvolge una funzione incognita y = y(x)<br />
(che <strong>di</strong>pende dalla sola variabile x) e le sue derivate. Usualmente si parla <strong>di</strong> equazione <strong>di</strong>fferenziale<br />
or<strong>di</strong>naria 1 in quanto la funzione incognita, essendo funzione <strong>di</strong> una sola variabile,<br />
ammette derivate or<strong>di</strong>narie e non derivate parziali.<br />
1 In inglese si <strong>di</strong>ce: Or<strong>di</strong>nary Differential Equation, da cui la sigla ODE.<br />
119
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Un esempio <strong>di</strong> equazione <strong>di</strong>fferenziale lineare è dato da<br />
y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />
dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue che <strong>di</strong>pendono<br />
dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />
fino a quella <strong>di</strong> or<strong>di</strong>ne n. Usiamo infatti la notazione y (n) per in<strong>di</strong>care dn y<br />
dx n .<br />
Se nell’equazione <strong>di</strong>fferenziale compaiono le derivate <strong>di</strong> y fino all’or<strong>di</strong>ne n, allora si <strong>di</strong>ce<br />
che l’equazione <strong>di</strong>fferenziale ha or<strong>di</strong>ne (o grado) n. Bisogna quin<strong>di</strong> vedere l’or<strong>di</strong>ne più elevato<br />
della derivata che appare nell’equazione per capire l’or<strong>di</strong>ne dell’equazione <strong>di</strong>fferenziale.<br />
Per n = 1, l’equazione <strong>di</strong>fferenziale <strong>di</strong> prima <strong>di</strong>venta<br />
y ′ + a(x)y = b(x)<br />
Per n = 2 si ha, invece,<br />
y ′′ + a 1 (x)y ′ + a 0 (x)y = b(x)<br />
Il caso più generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale <strong>di</strong> or<strong>di</strong>ne n è dato da un’equazione che<br />
ha come variabili x, la funzione incognita y e le sue derivate fino all’or<strong>di</strong>ne n, me<strong>di</strong>ante una<br />
funzione continua F (in genere non lineare):<br />
F (x, y, y ′ , . . . , y (n) ) = 0<br />
L’esempio <strong>di</strong> prima, <strong>di</strong> equazione <strong>di</strong>fferenziale lineare, ha come F la funzione<br />
F (x, y, y ′ , . . . , y (n) ) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y − b(x)<br />
Risolvere un’equazione <strong>di</strong>fferenziale (si <strong>di</strong>ce anche integrare un’equazione <strong>di</strong>fferenziale)<br />
vuol <strong>di</strong>re cercare le possibili (ve ne possono essere più <strong>di</strong> una) funzioni del tipo y = y(x)<br />
definite per x che varia in un opportuno intervallo [a, b], continue e derivabili n volte in [a, b]<br />
in modo che sia sod<strong>di</strong>sfatta l’equazione <strong>di</strong>fferenziale data.<br />
Le funzioni y = y(x) che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale si <strong>di</strong>cono soluzioni o integrali<br />
dell’equazione <strong>di</strong>fferenziale.<br />
Se un’equazione <strong>di</strong>fferenziale può essere scritta nella forma<br />
y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />
con f funzione continua allora si <strong>di</strong>ce che l’equazione <strong>di</strong>fferenziale è in forma normale.<br />
Esempio<br />
Es. 8.1.1 Data f, funzione continua in [a, b], si vuole risolvere<br />
y ′ (x) = f(x) ∀x ∈ [a, b]<br />
Questo problema equivale a quello <strong>di</strong> trovare una primitiva della funzione f, una<br />
funzione, cioè, la cui derivata coincide con f.<br />
Ogni funzione della forma y(x) = F (x) + y 0 con y 0 costante e F una primitiva <strong>di</strong> f è<br />
soluzione del problema assegnato, ovvero dell’equazione <strong>di</strong>fferenziale. Come primitiva<br />
<strong>di</strong> f, dal teorema fondamentale del calcolo integrale, sappiamo che possiamo scrivere<br />
F (x) = ∫ x<br />
x 0<br />
f(t)dt dove x 0 è un numero reale fissato in [a, b]. Quin<strong>di</strong> y(x) = ∫ x<br />
x 0<br />
f(t)dt + y 0 è<br />
soluzione del problema dato.<br />
120
8.2. Il problema <strong>di</strong> Cauchy in locale<br />
L’esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione<br />
y(x) per x = x 0 vale proprio la costante y 0 :<br />
y(x 0 ) =<br />
∫ x0<br />
x 0<br />
f(t)dt + y 0 = y 0<br />
In questo caso, si <strong>di</strong>ce che y(x) è soluzione del problema <strong>di</strong> Cauchy dato da<br />
{<br />
y ′ (x) = f(x)<br />
y(x 0 ) = y 0<br />
dove y(x 0 ) = y 0 rappresenta la con<strong>di</strong>zione iniziale e x 0 il punto iniziale da cui far partire<br />
la soluzione al problema.<br />
Ve<strong>di</strong>amo dunque cosa è un problema <strong>di</strong> Cauchy.<br />
8.2 Il problema <strong>di</strong> Cauchy in locale<br />
Partiamo dal considerare l’equazione <strong>di</strong>fferenziale<br />
y ′ = f(x, y)<br />
Se la f è non lineare, è ragionevole aspettarsi che le soluzioni dell’equazioni <strong>di</strong>fferenziale<br />
siano definite non in un intervallo assegnato a priori ma solo in un intorno <strong>di</strong> un punto<br />
iniziale assegnato.<br />
Fissati, dunque, x 0 e y 0 , supponiamo che:<br />
1. la f sia definita in un intorno rettangolare I × J del punto (x 0 , y 0 ) del tipo (siano a e b<br />
assegnati)<br />
{<br />
}<br />
I × J = (x, y) ∈ R 2 t.c x 0 − a ≤ x ≤ x 0 + a, y 0 − b ≤ y ≤ y 0 + b<br />
2. la f sia continua in I × J<br />
3. la derivata parziale della f rispetto a y, ∂f , sia continua in I × J.<br />
∂y<br />
Sotto queste ipotesi esiste un intorno <strong>di</strong> x 0 , [x 0 − δ, x 0 + δ] ed un’unica funzione y = y(x)<br />
derivabile in [x 0 − δ, x 0 + δ] che è soluzione del problema <strong>di</strong> Cauchy dato da<br />
{<br />
y ′ (x) = f(x, y)<br />
y(x 0 ) = y 0<br />
Abbiamo appena stabilito una formulazione del teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità<br />
locale (in piccolo).<br />
Teorema 8.2.1 (Teorema <strong>di</strong> Cauchy (in piccolo) per equazioni <strong>di</strong>fferenziali del primo or<strong>di</strong>ne)<br />
Sia f = f(x, y) una funzione reale definita nell’intervallo I × J (definito in precedenza). Se f<br />
e la sua derivata ∂f sono funzioni continue in I × J, allora esiste un numero δ > 0 ed esiste<br />
∂y<br />
una ed una sola funzione y = y(x) derivabile in [x 0 − δ, x 0 + δ], soluzione in tale intervallo del<br />
problema <strong>di</strong> Cauchy<br />
{<br />
y ′ (x) = f(x, y)<br />
y(x 0 ) = y 0<br />
121
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n, il problema <strong>di</strong> Cauchy prevede con<strong>di</strong>zioni iniziali<br />
non solo sulla funzione incognita y ma anche sulle sue derivate fino a quella <strong>di</strong> or<strong>di</strong>ne n − 1.<br />
Consideriamo, infatti, un punto (x 0 , y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />
0 ) ∈ R × R n . Sia I l’intervallo [x 0 −<br />
a, x 0 + a] (con a ∈ R), e J sia un intorno <strong>di</strong> R n del punto Y 0 = (y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />
0 ), quin<strong>di</strong><br />
J = {Y ∈ R n t.c. |Y − Y 0 | ≤ b}<br />
dove b ∈ R√<br />
e |Y − Y 0 | è il modulo del vettore Y − Y 0 (quin<strong>di</strong> se Y = (y 1 , y 2 , y 3 , . . . , y n ) si ha<br />
|Y − Y 0 | = (y 0 − y 1 ) 2 + (y 0 ′ − y 2) 2 + . . . (y (n−1)<br />
0 − y n ) 2 ).<br />
Vale il seguente teorema.<br />
Teorema 8.2.2 (Teorema <strong>di</strong> Cauchy in piccolo per eq. <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n) Sia f =<br />
f(x, y 1 , y 2 , y 3 , . . . , y n ) una funzione definita per x ∈ I e (y 1 , y 2 , . . . , y n ) ∈ J (I e J definiti prima).<br />
Sia f continua insieme alle derivate parziali fatte rispetto a y 1 , y 2 , . . . , y n . Allora esiste un<br />
numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x 0 − δ, x 0 + δ], che è<br />
soluzione del seguente problema <strong>di</strong> Cauchy:<br />
⎧<br />
y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />
y(x 0 ) = y 0<br />
⎪⎨ y ′ (x 0 ) = y 0<br />
′<br />
y ′′ (x 0 ) = y 0<br />
′′<br />
.<br />
⎪⎩<br />
y (n−1) (x 0 ) = y (n−1)<br />
0<br />
Con il teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità locale, sono date delle con<strong>di</strong>zioni sufficienti<br />
per risolvere localmente, in piccolo, il problema <strong>di</strong> Cauchy, determinando una soluzione<br />
in un intorno del punto iniziale x 0 .<br />
8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale)<br />
A volte è importante stabilire l’esistenza della soluzione del problema <strong>di</strong> Cauchy per un’equazione<br />
<strong>di</strong>fferenziale or<strong>di</strong>naria in un intervallo prefissato (quin<strong>di</strong> non in un intorno <strong>di</strong> x 0 ),<br />
cioè assegnato a priori, in cui l’equazione <strong>di</strong>fferenziale è definita.<br />
Per stabilire delle con<strong>di</strong>zioni sufficienti per risolvere globalmente, o in grande, il problema<br />
<strong>di</strong> Cauchy, occorre avere con<strong>di</strong>zioni più restrittive sulla funzione f.<br />
Nel caso <strong>di</strong> un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne, si hanno queste con<strong>di</strong>zioni:<br />
1. f(x, y) è definita in una striscia verticale <strong>di</strong> R 2 data da<br />
{<br />
}<br />
[a, b] × R = (x, y) ∈ R 2 t.c. x ∈ [a, b], y ∈ R<br />
2. f è continua<br />
3. la derivata parziale <strong>di</strong> f rispetto a y è continua e limitata, quin<strong>di</strong><br />
∣<br />
∂f(x, y)<br />
∂y<br />
∣ ≤ L per ogni<br />
(x, y) ∈ [a, b] × R, con L numero reale positivo.<br />
In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema <strong>di</strong> Cauchy<br />
{<br />
y ′ (x) = f(x, y)<br />
y(x 0 ) = y 0<br />
Possiamo enunciare il teorema:<br />
122
8.4. Definizioni<br />
Teorema 8.3.1 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. del primo or<strong>di</strong>ne))<br />
∂f(x, y)<br />
Se f = f(x, y) è continua in [a, b] × R e la sua derivata è continua e limitata in [a, b] × R,<br />
∂y<br />
allora per ogni x 0 ∈]a, b[ e per ogni y 0 ∈ R esiste una ed una sola funzione y = y(x), derivabile<br />
in [a, b] che risolve su tutto l’intervallo [a, b] il problema <strong>di</strong> Cauchy<br />
{<br />
y ′ (x) = f(x, y)<br />
y(x 0 ) = y 0<br />
Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n il teorema precedente si generalizza considerando<br />
funzioni f = f(x, y 1 , y 2 , y 3 , . . . , y n ) = f(x, Y ) definite nella striscia [a, b] × R n con<br />
{<br />
}<br />
[a, b] × R n = (x, Y ) = (x, y 1 , y 2 , y 3 , . . . , y n ) ∈ R n+1 , con x ∈ [a, b], y 1 ∈ R, . . . , y n ∈ R<br />
Teorema 8.3.2 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. <strong>di</strong> or<strong>di</strong>ne n))<br />
Se f = f(x, y 1 , y 2 , y 3 , . . . , y n ) è continua in [a, b] × R n e le derivate parziali fatte rispetto a y 1 ,<br />
y 2 , . . . , y n sono continue e limitate in [a, b] × R n , allora per ogni x 0 ∈]a, b[ e per ogni punto <strong>di</strong> R n<br />
dato da (y 0 , y 0, ′ . . . , y (n−1)<br />
0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che<br />
è soluzione del seguente problema <strong>di</strong> Cauchy:<br />
⎧<br />
y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />
y(x 0 ) = y 0<br />
⎪⎨ y ′ (x 0 ) = y 0<br />
′<br />
y ′′ (x 0 ) = y 0<br />
′′<br />
.<br />
⎪⎩<br />
y (n−1) (x 0 ) = y (n−1)<br />
0<br />
8.4 Definizioni<br />
Consideriamo ora un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne e introduciamo le seguenti<br />
definizioni.<br />
G Per integrale generale si intende l’insieme delle soluzioni dell’equazione <strong>di</strong>fferenziale<br />
che varia al variare <strong>di</strong> una costante c: qualunque sia la coppia (x 0 , y 0 ) si può stabilire il<br />
valore della costante c tale che y(c, x 0 ) = y 0 .<br />
G Per integrale particolare si intende invece una soluzione particolare dell’equazione<br />
<strong>di</strong>fferenziale: fissata una coppia (x 0 , y 0 ) esiste una costante c tale che y(c, x 0 ) = y 0 .<br />
G Si ha invece un integrale singolare se, data una coppia (x 0 , y 0 ), non esiste una costante c<br />
tale che y(c, x 0 ) = y 0 , vale a <strong>di</strong>re che per quella coppia <strong>di</strong> dati, la soluzione dell’equazione<br />
<strong>di</strong>fferenziale non rientra in un integrale particolare.<br />
8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne<br />
Sia y ′ = f(x, y) con f funzione lineare in y, del tipo f(x, y) = b(x) − a(x)y.<br />
Si ha, quin<strong>di</strong>, per l’equazione <strong>di</strong>fferenziale:<br />
y ′ = f(x, y) =⇒ y ′ = b(x) − a(x)y =⇒ y ′ + a(x)y = b(x)<br />
Ve<strong>di</strong>amo ora tutti i passaggi per trovare l’integrale generale <strong>di</strong> questa equazione<br />
<strong>di</strong>fferenziale.<br />
1. Sia A(x) = ∫ a(x)dx una primitiva <strong>di</strong> a(x). Poniamo m(x) = e A(x) .<br />
123
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
2. Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x), ottenendo:<br />
m(x)y ′ (x) + m(x)a(x)y(x) = m(x)b(x) (8.1)<br />
3. Consideriamo ora la derivata <strong>di</strong> m(x). Si ha<br />
dm(x)<br />
dx<br />
= deA(x)<br />
dx<br />
A(x) dA(x)<br />
= e = m(x) dA(x)<br />
dx<br />
dx<br />
ma essendo A(x) una primitiva <strong>di</strong> a(x) vuole <strong>di</strong>re che dA(x)<br />
dx<br />
dm(x)<br />
dx<br />
= m(x)a(x)<br />
= a(x), da cui si ricava<br />
4. Facciamo ora la derivata <strong>di</strong> y(x)m(x). Abbiamo da fare la derivata <strong>di</strong> un prodotto <strong>di</strong><br />
funzioni, da cui<br />
d(y(x)m(x))<br />
dx<br />
= dy(x)<br />
dx<br />
m(x) + y(x)dm(x) dx<br />
La derivata <strong>di</strong> m(x) l’abbiamo appena ricavata, la derivata <strong>di</strong> y(x) è y ′ (x), da cui<br />
d(y(x)m(x))<br />
dx<br />
= m(x)y ′ (x) + m(x)a(x)y(x)<br />
Abbiamo trovato il primo membro dell’equazione 8.1.<br />
5. Possiamo quin<strong>di</strong> riscrivere l’equazione 8.1 come<br />
d(y(x)m(x))<br />
dx<br />
= m(x)b(x)<br />
6. Integrando ambo i membri dell’equazione e <strong>di</strong>videndo poi per m(x) (<strong>di</strong>versa da zero<br />
perche è e A(x) ) si ha<br />
∫ ∫<br />
dy(x)m(x)<br />
dx = m(x)b(x)dx + costante<br />
dx<br />
∫<br />
y(x)m(x) = m(x)b(x)dx + costante<br />
y(x) = 1 (∫<br />
)<br />
m(x)b(x)dx + costante<br />
m(x)<br />
7. Riscrivendo la funzione m(x) come e A(x) si ha<br />
(∫<br />
)<br />
y(x) = e −A(x) e A(x) b(x)dx + costante<br />
L’integrale è generale perchè <strong>di</strong>pende da una costante.<br />
Osserviamo, inoltre, che se a(x) e b(x) sono continue in un certo intervallo [a, b], allora il<br />
problema <strong>di</strong> Cauchy che possiamo associare a questa equazione <strong>di</strong>fferenziale si può risolvere<br />
globalmente in [a, b]×R poichè valgono le ipotesi del teorema <strong>di</strong> esistenza e unicità globale (la<br />
funzione f = b(x)−a(x)y è continua e la derivata ∂f = −a(x) è continua e limitata (poichè a(x)<br />
∂y<br />
<strong>di</strong>pende solo da x ed è continua in un intervallo chiuso allora ammette minimo e massimo,<br />
cioè è limitata).<br />
124
8.6. Metodo <strong>di</strong> separazione delle variabili<br />
Esempio<br />
Es. 8.5.1 Risolviamo l’equazione <strong>di</strong>fferenziale y ′ + 4xy = x. In questo esempio a(x) = 4x<br />
e b(x) = x. Applichiamo il proce<strong>di</strong>mento appena descritto.<br />
G A(x) = ∫ a(x)dx = ∫ 4xdx = 2x 2 da cui m(x) = e 2x2 .<br />
G Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x) ricavando:<br />
e 2x2 y ′ (x) + e 2x2 4xy(x) = e 2x2 x<br />
G Abbiamo allora<br />
dy(x)e 2x2<br />
dx<br />
= e 2x2 x<br />
G Integrando ambo i membri e <strong>di</strong>videndo poi per e 2x2 si ha<br />
∫<br />
y(x) = e −2x2 e 2x2 xdx<br />
Dobbiamo quin<strong>di</strong> calcolare ∫ e 2x2 xdx: considerando che la derivata dell’esponente è<br />
4x, basta moltiplicare e <strong>di</strong>videre per 4 ottenendo:<br />
∫<br />
e 2x2 xdx = 1 ∫<br />
4xe 2x2 dx = 1 ∫<br />
D(2x 2 )e 2x2 dx = 1 + costante<br />
4<br />
4<br />
4 e2x2<br />
Quin<strong>di</strong><br />
y(x) = e −2x2 ( 1 4 e2x2 + costante) = 1 4 + Ce−2x2<br />
dove C rappresenta la costante.<br />
8.6 Metodo <strong>di</strong> separazione delle variabili<br />
Se un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne può essere scritta nella forma<br />
y ′ (x) = p(x)q(y)<br />
con p(x) e q(y) continue, allora l’equazione si <strong>di</strong>ce a variabili separabili.<br />
Ve<strong>di</strong>amo come si risolve questa equazione nel caso in cui q(y) ≠ 0 per ogni y. In tal caso,<br />
possiamo <strong>di</strong>videre ambo i membri per q(y), ottenendo<br />
y ′ (x)<br />
q(y) = p(x)<br />
Integriamo ambo i membri dell’equazione rispetto a x, ricavando:<br />
∫<br />
y ′ ∫<br />
(x)<br />
q(y(x)) dx = p(x)dx (8.2)<br />
In modo equivalente possiamo scrivere anche<br />
∫<br />
∫<br />
1<br />
q(y) dy = p(x)dx<br />
125
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Sia Q(y) una primitiva <strong>di</strong><br />
dQ(y(x))<br />
dx<br />
= dQ(y(x))<br />
dy<br />
1<br />
e P una primitiva <strong>di</strong> p. Vuol <strong>di</strong>re che<br />
q(y)<br />
dy<br />
dx = 1<br />
q(y(x)) y′ (x),<br />
dP (x)<br />
mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive <strong>di</strong><br />
dx<br />
ciascuno dei due integrali, si ha<br />
Q(y(x)) = P (x) + costante<br />
Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo<br />
lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione me<strong>di</strong>ante<br />
la relazione Q(y(x)) − P (x) = costante.<br />
Esempio<br />
Es. 8.6.1 Sia da risolvere il problema <strong>di</strong> Cauchy, y ′ = x2<br />
con la con<strong>di</strong>zione iniziale y(0) =<br />
y2 4.<br />
Risolviamo prima l’equazione <strong>di</strong>fferenziale, applicando il metodo <strong>di</strong> separazione delle<br />
variabili (p(x) = x 2 , q(y) = 1 ). Separando le variabili infatti, abbiamo da risolvere:<br />
y2 ovvero<br />
∫ ∫<br />
y 2 dy = x 2 dx<br />
y 3<br />
3 = x3<br />
3 + costante<br />
Risolvendo ora per y (che è funzione <strong>di</strong> x) otteniamo:<br />
y(x) = (x 3 + 3costante) 1/3<br />
Poichè la costante è arbitraria possiamo scrivere C = 3costante ricavando<br />
y(x) = (x 3 + C) 1/3<br />
Imponiamo ora la con<strong>di</strong>zione iniziale y(0) = 4. Deve essere 4 = (C) 1/3 da cui C = 4 3 = 64.<br />
Quin<strong>di</strong> la soluzione del problema è data da y(x) = (x + 64) 1/3 .<br />
8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali<br />
G Sia data un’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne, in cui manca il termine in y:<br />
F (x, y ′ , y ′′ ) = 0<br />
In tal caso, si pone z(x) = y ′ (x), da cui z ′ (x) = y ′′ (x).<br />
trasformata <strong>di</strong>venta:<br />
F (x, z, z ′ ) = 0<br />
L’equazione <strong>di</strong>fferenziale<br />
Abbiamo un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne nella incognita z. Una volta trovata<br />
z soluzione dell’equazione <strong>di</strong>fferenziale, quin<strong>di</strong> z = z(x, cost 1 ), si ricava y cercando<br />
una primitiva <strong>di</strong> z:<br />
∫<br />
y(x) = z(x, cost 1 )dx + cost 2<br />
126
8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />
G Se l’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne non <strong>di</strong>pende esplicitamente da x<br />
F (y, y ′ , y ′′ ) = 0<br />
allora si pensa y come variabile in<strong>di</strong>pendente e si si pone z(y) = y ′ .<br />
Allora (considerando che y è funzione <strong>di</strong> x e z è funzione <strong>di</strong> y):<br />
y ′′ = dy′<br />
dx = dz(y)<br />
dx<br />
= dz dy<br />
dy dx = z′ z<br />
Quin<strong>di</strong> l’equazione <strong>di</strong>fferenziale <strong>di</strong>venta<br />
F (y, z, z ′ z) = 0<br />
Se si trova un’integrale generale <strong>di</strong> questa equazione, z = z(y, cost), allora, per trovare<br />
y, dalla relazione y ′ = z(y, cost) si ricava la soluzione y osservando che questa che<br />
abbiamo appena scritto è un’equazione <strong>di</strong>fferenziale a variabili separabili.<br />
G Ci sono molti altri casi <strong>di</strong> equazioni <strong>di</strong>fferenziali non lineari che presentano una forma<br />
particolare e che possono essere risolte me<strong>di</strong>ante tecniche ad hoc. Non stiamo però a<br />
stu<strong>di</strong>arle in questa sede.<br />
8.8 Le equazioni <strong>di</strong>fferenziali lineari<br />
Ripren<strong>di</strong>amo l’esempio visto quando abbiamo introdotto le equazioni <strong>di</strong>fferenziali:<br />
y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />
dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue, che <strong>di</strong>pendono<br />
dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />
fino a quella <strong>di</strong> or<strong>di</strong>ne n.<br />
Un’equazione <strong>di</strong>fferenziale scritta in questa forma, prende il nome <strong>di</strong> equazione<br />
<strong>di</strong>fferenziale lineare, perchè è lineare rispetto a y e alle sue derivate.<br />
G Se ciascuna funzione a i (x), per i = 0, 2, . . . , n−1 è costante rispetto alla variabile x, allora<br />
l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale lineare a coefficienti<br />
costanti.<br />
G Se b(x) = 0 per ogni valore <strong>di</strong> x, allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale<br />
omogenea.<br />
G Se b(x) ≠ 0 allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale non omogenea.<br />
L’equazione che si ha ponendo b(x) ≡ 0 si <strong>di</strong>ce equazione omogenea associata<br />
all’equazione <strong>di</strong> partenza in cui b(x) ≠ 0.<br />
Per quanto riguarda il problema <strong>di</strong> Cauchy associato ad un’equazione <strong>di</strong>fferenziale lineare<br />
<strong>di</strong> or<strong>di</strong>ne n, vale il seguente teorema.<br />
Teorema 8.8.1 Se le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x) sono continue in un intervallo [a, b], allora<br />
il problema <strong>di</strong> Cauchy<br />
⎧<br />
y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)y(x 0 ) = y 0<br />
y ⎪⎨<br />
′ (x 0 ) = y 0<br />
′<br />
y ′′ (x 0 ) = y 0<br />
′′<br />
.<br />
⎪⎩<br />
y (n−1) (x 0 ) = y (n−1)<br />
0<br />
ammette sempre un’unica soluzione y(x) qualunque sia il punto (x 0 , y 0 , y ′ 0, . . . , y (n−1)<br />
0 ) associato<br />
alle con<strong>di</strong>zioni iniziali.<br />
127
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Dimostrazione.<br />
Infatti, l’equazione <strong>di</strong>fferenziale si può scrivere come<br />
y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />
con f(x, y, y ′ , . . . , y (n−1) ) = b(x) − a n−1 (x)y (n−1) − . . . − a 1 (x)y ′ − a 0 (x)y.<br />
Riscrivendo la f come una funzione <strong>di</strong>pendente da x e da un punto Y = (y 1 , y 2 , . . . , y n ),<br />
(quin<strong>di</strong> f(x, Y ) = b(x) − a n−1 (x)y n − . . . a 1 (x)y 2 − a 0 (x)y 1 ) si ha che<br />
∂f<br />
∂y i<br />
= −a i−1 (x)<br />
Quin<strong>di</strong> ciascuna derivata è una funzione continua e limitata in [a, b] per cui sono sod<strong>di</strong>sfatte<br />
le ipotesi del teorema <strong>di</strong> Cauchy in grande, qualcunque sia il punto iniziale assegnato.<br />
✔<br />
Per provare alcune proprietà generali delle equazioni <strong>di</strong>fferenziali lineari, conviene introdurre<br />
alcune notazioni. La prima consiste nel vedere l’equazione <strong>di</strong>fferenziale come il<br />
risultato <strong>di</strong> un operatore L applicato alla funzione y(x).<br />
Introduciamo dunque l’operatore L che agisce su una funzione f(x) nel modo seguente:<br />
L(f) = f (n) + a n−1 (x)f (n−1) + a n−2 (x)f (n−2) + . . . + a 0 (x)f<br />
Introducendo i simboli D e D n per in<strong>di</strong>care la derivata prima e la derivata n-sima rispetto<br />
a x, D = d<br />
dx , Dn = dn<br />
, l’operatore L si può scrivere come<br />
dxn L = D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x)<br />
Allora l’equazione <strong>di</strong>fferenziale lineare<br />
y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />
può essere scritta come<br />
L(y) = b(x)<br />
Difatti:<br />
L(y) = (D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x))y<br />
= D n (y) + a n−1 (x)D n−1 (y) + . . . + a 0 (x)y<br />
= y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y<br />
Usando l’operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale:<br />
1. L(y 1 + y 2 ) = L(y 1 ) + L(y 2 )<br />
2. L(αy) = αL(y), dove α è una costante.<br />
Queste due proprietà <strong>di</strong>cono che L è un operatore lineare.<br />
Quin<strong>di</strong>, dato l’operatore L appena definito:<br />
G L(y) = b(x) è un’equazione <strong>di</strong>fferenziale lineare non omogenea. La funzione b(x) prende<br />
il nome <strong>di</strong> termine noto dell’equazione <strong>di</strong>fferenziale.<br />
G L(y) = 0 è l’equazione <strong>di</strong>fferenziale omogenea (il termine noto vale zero) associata<br />
all’equazione <strong>di</strong>fferenziale precedente, in quanto l’operatore L è lo stesso.<br />
Possiamo stabilire questo risultato.<br />
Teorema 8.8.2 Se y 1 , y 2 , . . . , y m sono un numero finito m <strong>di</strong> soluzioni dell’equazione <strong>di</strong>fferenziale<br />
lineare omogenea L(y) = 0, allora anche ogni funzione data da c 1 y 1 + c 2 y 2 + . . . + c m y m ,<br />
con c 1 , c 2 , . . . , c m costanti <strong>di</strong> R, è soluzione <strong>di</strong> L(y) = 0,<br />
128
8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />
Dimostrazione. La <strong>di</strong>mostrazione segue dal fatto che L è un operatore lineare. Da<br />
L(y 1 ) = 0, L(y 2 ) = 0, . . . L(y m ) = 0, e applicando la linearità <strong>di</strong> L, si ha<br />
✔<br />
L(c 1 y 1 + c 2 y 2 + . . . + c m y m ) = L(c 1 y 1 ) + L(c 2 y 2 ) + . . . L(c m y m )<br />
= c 1 L(y 1 ) + c 2 L(y 2 ) + . . . + c m L(y m )<br />
= 0<br />
Teorema 8.8.3 Data l’equazione <strong>di</strong>fferenziale L(y) = 0 con le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x)<br />
continue in un intervallo [a, b], allora per ogni x 0 ∈]a, b[, la funzione identicamente nulla è l’unica<br />
soluzione del problema <strong>di</strong> Cauchy L(y) = 0 con con<strong>di</strong>zioni iniziali date da<br />
y(x 0 ) = 0, y ′ (x 0 ) = 0, . . . , y (n−1) (x 0 ) = 0<br />
Dimostrazione. La <strong>di</strong>mostrazione segue dal teorema <strong>di</strong> esistenza ed unicità del problema<br />
<strong>di</strong> Cauchy, considerando che la funzione nulla risolve l’equazione <strong>di</strong>fferenziale con le<br />
con<strong>di</strong>zioni iniziali tutte nulle. ✔<br />
Chiamiamo con il simbolo N l’insieme delle soluzioni <strong>di</strong> un’equazione <strong>di</strong>fferenziale lineare<br />
omogenea data me<strong>di</strong>ante l’operatore L. Questo insieme prende il nome <strong>di</strong> spazio nullo<br />
dell’operatore L. L’insieme N è uno spazio vettoriale sul campo dei reali.<br />
8.8.1 Cosa è uno spazio vettoriale<br />
Consideriamo un insieme N (non necessariamente quello <strong>di</strong> prima), costituito da funzioni<br />
reali definite in R. Sia 0 lo zero <strong>di</strong> N, vale a <strong>di</strong>re la funzione identicamente nulla.<br />
N è uno spazio vettoriale (sui reali), se:<br />
G è possibile definire un’operazione interna + sugli elementi dell’insieme N, chiamata<br />
somma, che gode della proprietà associativa e commutativa, per la quale esiste<br />
l’elemento neutro (lo zero), e ogni elemento ha l’opposto.<br />
G è possibile definire un’operazione esterna · <strong>degli</strong> elementi <strong>di</strong> N sui reali, chiamata<br />
prodotto per la quale<br />
– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 c 2 ) · f = c 1 · (c 2 · f)<br />
– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 + c 2 ) · f = (c 1 · f) + (c 2 · f)<br />
– per ogni c in R e per ogni f e g in N, si ha c · (f + g) = c · f + c · g<br />
– per ogni f in N, si ha 1 · f = f<br />
Un elemento dello spazio vettoriale prende il nome <strong>di</strong> vettore.<br />
Siano ora y 1 , y 2 , . . . , y n n elementi dello spazio vettoriale N. Si <strong>di</strong>ce combinazione lineare<br />
dei vettori y 1 , y 2 , . . . , y n me<strong>di</strong>ante i coefficienti c 1 , c 2 , . . . , c n <strong>di</strong> R, il vettore dato da<br />
c 1 y 1 + c 2 y 2 + . . . c n y n .<br />
Gli n vettori y 1 , y 2 , . . . , y n si <strong>di</strong>cono linearmente in<strong>di</strong>pendenti se l’unica combinazione<br />
lineare dei vettori y 1 , y 2 , . . . , y n che produce il vettore nullo è data da coefficienti tutti nulli:<br />
c 1 y 1 + c 2 y 2 + . . . c n y n = 0 ⇐⇒ c 1 = c 2 = . . . = c n = 0<br />
Se uno spazio vettoriale ha n vettori linearmente in<strong>di</strong>pendenti allora si <strong>di</strong>ce che lo spazio<br />
ha <strong>di</strong>mensione n. I vettori linearmente in<strong>di</strong>pendenti costituiscono una base dello spazio.<br />
Ogni funzione dello spazio può essere ottenuta me<strong>di</strong>ante una combinazione lineare della<br />
base, cioè dei suoi vettori linearmente in<strong>di</strong>pendenti.<br />
129
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
8.9 L’equazione omogenea<br />
Torniamo all’equazione <strong>di</strong>fferenziale omogenea L(y) = 0 e cerchiamo <strong>di</strong> caratterizzare le<br />
sue soluzioni.<br />
Sia L(y) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y e sia data l’equazione <strong>di</strong>fferenziale<br />
L(y) = 0.<br />
Siano y 1 , y 2 , . . . , y n n integrali particolari, per x ∈ [a, b], dell’equazione <strong>di</strong>fferenziale omogenea.<br />
Per capire se questi integrali sono linearmente in<strong>di</strong>pendenti, abbiamo bisogno <strong>di</strong> introdurre<br />
il cosiddetto determinante wronskiano o, semplicemente, il wronskiano delle funzioni<br />
y 1 , y 2 , . . . , y n , che è dato dalla funzione w(x) definita per x ∈ [a, b] me<strong>di</strong>ante il determinante<br />
y 1 (x) y 2 (x) . . . y n (x)<br />
y 1(x) ′ y 2(x) ′ . . . y ′ n(x)<br />
w(x) =<br />
y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />
′′<br />
. . . . . .<br />
∣y (n−1)<br />
1 (x) y (n−1)<br />
2 (x) . . . y n<br />
(n−1) (x) ∣<br />
Teorema 8.9.1 Sia dato l’operatore L definito tramite le n funzioni a 0 (x), a 1 (x), . . . , a n−1 (x),<br />
continue in un intervallo aperto ]a, b[⊂ R. Siano y 1 (x), y 2 (x), . . . , y n (x) n funzioni <strong>di</strong>verse da zero<br />
che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale:<br />
L(y 1 ) = L(y 2 ) = · · · = L(y n ) = 0<br />
Con<strong>di</strong>zione necessaria e sufficiente affinchè le n soluzioni siano linearmente in<strong>di</strong>pendenti è<br />
che sia <strong>di</strong>verso da zero per ogni valore <strong>di</strong> x ∈]a, b[, il wronskiano w(x).<br />
Teorema 8.9.2 Lo spazio delle funzioni che sono soluzione dell’equazione omogenea L(y) = 0<br />
(lo spazio nullo N) ha <strong>di</strong>mensione n, ovvero, l’equazione omogenea L(y) = 0 ammette sempre<br />
un sistema <strong>di</strong> n integrali linearmente in<strong>di</strong>pendenti.<br />
Dimostrazione.<br />
Si fissi x 0 ∈ R e si considerino gli n problemi <strong>di</strong> Cauchy<br />
(1)L(y) = 0, y(x 0 ) = 1, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />
(2)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 1, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />
(3)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 1, . . . y (n−1) (x 0 ) = 0<br />
.<br />
(n)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 1<br />
Quin<strong>di</strong> l’i-mo problema <strong>di</strong> Cauchy ha con<strong>di</strong>zioni iniziali tutte nulle, eccetto la derivata<br />
y (i−1) che in x 0 vale 1.<br />
Per ciascuno <strong>di</strong> questi problemi <strong>di</strong> Cauchy, la soluzione esiste ed è unica (per il teorema<br />
<strong>di</strong> esistenza e unicità visto prima).<br />
Consideriamo ora il wronskiano delle n funzioni y i (per i = 1, 2, . . . , n) che sono soluzioni<br />
<strong>di</strong> questi problemi <strong>di</strong> Cauchy:<br />
130<br />
w(x) =<br />
∣<br />
y 1 (x) y 2 (x) . . . y n (x)<br />
y 1(x) ′ y 2(x) ′ . . . y n(x)<br />
′ y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />
′′<br />
. . . . . .<br />
1 (x) y (n−1)<br />
2 (x) . . . y n<br />
(n−1) (x) ∣<br />
y (n−1)
8.10. L’equazione non omogenea<br />
Valutiamo w(x) per x = x 0 . Si ha<br />
1 0 . . . 0<br />
0 1 . . . 0<br />
w(x 0 ) =<br />
. . . . . .<br />
∣0 0 . . . 1∣<br />
Risulta che w(x 0 ) è il determinante della matrice identità, che ha uno sugli elementi della<br />
<strong>di</strong>agonale principale e zero altrove. Il determinante <strong>di</strong> questa matrice vale 1, quin<strong>di</strong> è <strong>di</strong>verso<br />
da zero.<br />
Poichè x 0 è stato scelto in modo arbitrario in R, vuole <strong>di</strong>re che le n soluzioni dell’equazioni<br />
<strong>di</strong>fferenziali sono linearmente in<strong>di</strong>pendenti (in base al teorema 8.9.1).<br />
Abbiamo trovato dunque n funzioni linearmente in<strong>di</strong>pendenti che risolvono l’equazione<br />
omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni<br />
dell’equazione L(y) = 0. ✔<br />
Definizione 8.9.1 Una n-pla <strong>di</strong> funzioni y 1 , y 2 , . . . , y n che sono soluzioni linearmente in<strong>di</strong>pendenti<br />
<strong>di</strong> L(y) = 0 prende il nome <strong>di</strong> sistema fondamentale <strong>di</strong> integrali <strong>di</strong> L(y) =<br />
0.<br />
Se conosciamo n soluzioni linearmente in<strong>di</strong>pendenti <strong>di</strong> L(y) = 0, la generica soluzione<br />
<strong>di</strong> L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente in<strong>di</strong>pendenti.<br />
Questa generica soluzione prende il nome <strong>di</strong> integrale generale. Si ha il seguente teorema<br />
Teorema 8.9.3 (Sull’integrale generale <strong>di</strong> un’equazione omogenea) Dato un sistema fondamentale<br />
<strong>di</strong> integrali y 1 , y 2 , . . . , y n dell’equazione <strong>di</strong>fferenziale omogenea L(y) = 0, l’integrale<br />
generale è dato dalle combinazioni lineari<br />
y = c 1 y 1 + c 2 y 2 + . . . c n y n<br />
con c 1 , c 2 , . . . , c n costanti <strong>di</strong> R.<br />
8.10 L’equazione non omogenea<br />
Sia data ora un’equazione <strong>di</strong>fferenziale non omogenea<br />
L(y) = b(x)<br />
.<br />
Sappiamo che ad essa possiamo associare l’equazione <strong>di</strong>fferenziale omogenea<br />
L(y) = 0<br />
Se conosciamo un integrale particolare dell’equazione non omogenea, y, e conosciamo<br />
l’integrale generale dell’equazione omogenea associata, y, allora l’integrale generale dell’equazione<br />
non omogenea, che in<strong>di</strong>chiamo con η, è dato dalla somma <strong>di</strong> y e <strong>di</strong> y. Vale infatti il<br />
seguente teorema.<br />
Teorema 8.10.1 Dato y integrale particolare <strong>di</strong> L(y) = b(x), e dato l’integrale generale y <strong>di</strong><br />
L(y) = 0, allora l’integrale generale <strong>di</strong> L(y) = b(x) è dato da<br />
η = y + y<br />
131
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Dimostrazione.<br />
Consideriamo η = y + y. Si ha<br />
L(η) = L(y + y)<br />
applicando la linearità <strong>di</strong> L<br />
= L(y) + L(y)<br />
ma L(y) = 0 e L(y) = b(x)<br />
= b(x)<br />
Quin<strong>di</strong> η è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />
Supponiamo che y ∗ sia un altro integrale particolare <strong>di</strong>verso da y, per l’equazione non<br />
omogenea, L(y ∗ ) = b(x), allora y ∗ = y ∗ − y risulta un integrale dell’omogenea associata, in<br />
quanto<br />
L(y ∗ ) = L(y ∗ − y) = L(y ∗ ) − L(y) = b(x) − b(x) = 0<br />
Quin<strong>di</strong> y ∗ si può scrivere come combinazione lineare <strong>di</strong> un sistema fondamentale <strong>di</strong> integrali<br />
dell’equazione omogenea, tramite dei coefficienti c 1 , c 2 , . . . , c n . Perciò y ∗ = y ∗ + y rientra come<br />
caso particolare (perchè y ∗ è caratterizzato da specifici coefficienti) dell’integrale generale<br />
η = y + y, cioè η = y + y è l’unico modo per rappresentare l’integrale generale dell’equazione<br />
non omogenea. ✔<br />
Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale L(y) = b(x), conoscendo n integrali<br />
linearmente in<strong>di</strong>pendenti dell’equazione omogenea associata, e un integrale particolare y<br />
della non omogenea, è dato da dato da<br />
y = c 1 y 1 + c 2 y 2 + . . . , c n y n + y<br />
8.11 Equazioni lineari a coefficienti costanti<br />
Data l’equazione <strong>di</strong>fferenziale<br />
y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />
se a 0 (x) ≡ a 0 , a 1 (x) ≡ a 1 , . . . , a n−1 (x) = a n−1 , tutte le funzioni sono costanti in x, allora<br />
l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale a coefficienti costanti:<br />
y (n) + a n−1 y (n−1) + . . . + a 1 y ′ + a 0 y = b(x)<br />
Per trovare l’integrale generale dell’equazione lineare a coefficienti costanti, si considera<br />
la cosiddetta equazione caratteristica, che si ricava dall’equazione <strong>di</strong>fferenziale omogenea<br />
associata, sostituendo alle derivate della funzione incognita le potenze della variabile z:<br />
P (z) = z n + a n−1 z n−1 + . . . + a 1 z + a 0 = 0<br />
Quin<strong>di</strong> a y (n) sostituiamo z n , a y (n−1) sostituiamo z n−1 m fino ad arrivare a y che sostituiamo<br />
con z 0 = 1. Il polinomio P (z) prende il nome <strong>di</strong> polimonio caratteristico. Si cercano le ra<strong>di</strong>ci<br />
del polinomio caratteristico, cioè i valori <strong>di</strong> z per cui P (z) = 0 e da queste ra<strong>di</strong>ci è possibile<br />
risalire (vedremo ora in che modo) all’integrale generale dell’equazione <strong>di</strong>fferenziale lineare<br />
omogenea. Occorre poi trovare un integrale particolare per l’equazione non omogenea.<br />
Ricor<strong>di</strong>amo che un polinomio <strong>di</strong> grado n ammette n ra<strong>di</strong>ci: queste ra<strong>di</strong>ci possono essere<br />
reali o complesse, e possono essere con molteplicità semplice o <strong>di</strong> un certo grado, ma tali<br />
che la somma dei gra<strong>di</strong> <strong>di</strong> ciascuna ra<strong>di</strong>ce <strong>di</strong>a il grado del polinomio. Ve<strong>di</strong>amo dei semplici<br />
esempi.<br />
132
8.11. Equazioni lineari a coefficienti costanti<br />
Esempio<br />
Es. 8.11.1 Consideriamo un polinomio <strong>di</strong> secondo grado. Sappiamo che, dato un polinomio<br />
<strong>di</strong> secondo grado P (z) = az 2 + bz + c, per trovare le ra<strong>di</strong>ci del polinomio, cioè quei<br />
valori <strong>di</strong> z per cui P (z) = 0 si ha la formula z = −b ± √ b 2 − 4ac<br />
, dove la quantità sotto<br />
2a<br />
ra<strong>di</strong>ce, b 2 − 4ac prende il nome <strong>di</strong> <strong>di</strong>scrimante e viene in<strong>di</strong>cato con il simbolo ∆.<br />
GSe ∆ = b 2 − 4ac > 0 si hanno due ra<strong>di</strong>ci reali <strong>di</strong>stinte.<br />
Esempio: P (z) = z 2 − 5z − 6.<br />
In questo caso ∆ = 25 + 24 = 49, da cui z = 5 ± 7<br />
2 . Si hanno due ra<strong>di</strong>ci <strong>di</strong>stinte: z 1 = 6 e<br />
z 2 = −1.<br />
GSe ∆ = b 2 − 4ac = 0 si hanno due ra<strong>di</strong>ci reali coincidenti (una ra<strong>di</strong>ce da contarsi due<br />
volte, o con molteplicità due).<br />
Esempio: P (z) = z 2 − 2z + 1. Qui ∆ = 4 − 4 = 0. Si ricava facilmente, o applicando la<br />
formula, o riconoscendo che P (z) = (z − 1) 2 , che la ra<strong>di</strong>ce è z = 1 da contarsi due volte,<br />
cioè z = 1 è una ra<strong>di</strong>ce con molteplicità doppia.<br />
GSe ∆ = b 2 − 4ac < 0, non si hanno ra<strong>di</strong>ci reali ma nel campo complesso, introducendo<br />
l’unità immaginaria i = √ −1, per cui √ b 2 − 4ac = √ (−1)(4ac − b 2 ) = i √ 4ac − b 2 , essendo<br />
ora 4ac − b 2 > 0.<br />
Esempio: P (z) = z 2 + 2z + 3. In questo caso ∆ = 4 − 12 = −8 Sotto ra<strong>di</strong>ce ho −8, quin<strong>di</strong> le<br />
ra<strong>di</strong>ci sono complesse.<br />
z = −2 ± i2√ 2<br />
2<br />
= −1 ± i √ 2<br />
Trovo due ra<strong>di</strong>ci z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2.<br />
Queste due ra<strong>di</strong>ci sono complesse e coniugate, perchè la parte immaginaria delle due<br />
ra<strong>di</strong>ci è una l’opposta dell’altra.<br />
Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i<br />
l’unità immaginaria. Il coniugato <strong>di</strong> z = a + ib è dato da z = a − ib.<br />
Per determinare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale omogenea si vanno a<br />
cercare le ra<strong>di</strong>ci del polinomio caratteristico. Supponiamo che il polimonio caratteristico<br />
abbia n ra<strong>di</strong>ci reali tutte <strong>di</strong>stinte tra <strong>di</strong> loro, γ 1 , γ 2 , . . . , γ n , allora le funzioni y(x) = e γix<br />
sono soluzioni particolari dell’equazione <strong>di</strong>fferenziale. Infatti da y(x) = e γx si ha y ′ = γe γx ,<br />
y ′′ = γ 2 e γx , . . . , y (n) = γ n e γx . Se an<strong>di</strong>amo a sostituire nell’equazione <strong>di</strong>fferenziale, ricaviamo<br />
L(y) = L(e γx )<br />
= γ n e γx + a n−1 γ n−1 e γx + . . . + a 1 γe γx + a 0 e γx<br />
metto in evidenza e γx<br />
= (γ n + a n−1 γ n−1 + . . . + a 1 γ + a 0 )e γx<br />
= P (γ)e γx<br />
ma γ è ra<strong>di</strong>ce dell’equazione caratteristica<br />
= 0<br />
Quin<strong>di</strong> y = e γx è soluzione dell’equazione <strong>di</strong>fferenziale lineare omogenea.<br />
In genere, però, un polinomio <strong>di</strong> grado n può avere ra<strong>di</strong>ci reali che si ripetono (che hanno<br />
una certa molteplicità), o ra<strong>di</strong>ci reali insieme a ra<strong>di</strong>ci complesse e coniugate (e anche queste<br />
ra<strong>di</strong>ci possono avere una certa molteplicità).<br />
Per ricavare l’integrale generale <strong>di</strong> un’equazione lineare omogenea, viene in aiuto il<br />
seguente teorema.<br />
133
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Teorema 8.11.1 Siano γ 1 , γ 2 , . . . , γ h h ra<strong>di</strong>ci reali del polinomio caratteristico, ciascuna delle<br />
quali ha rispettivamente molteplicità r 1 , . . . , r h mentre siano α 1 ± iβ 1 , α 2 ± iβ 2 , . . . , α l ± iβ k 2k<br />
ra<strong>di</strong>ci complesse e coniugate con molteplicità, rispettivamente, s 1 , s 2 , . . . , s k .<br />
La molteplicità delle ra<strong>di</strong>ci è tale che r 1 + r 2 + . . . + r h + 2(s 1 + s 2 + . . . + s k ) = n.<br />
Allora le n funzioni<br />
e γpx , xe γpx , . . . x rp−1 e γpx , per p = 1, 2, . . . , h<br />
e αqx cos (β q x), e αqx sin (β q x), xe αqx cos (β q x), xe αqx sin (β q x), . . . ,<br />
x sq−1 e αqx cos (β q x), x sq−1 e αqx sin (β q x), per q = 1, 2, . . . , k<br />
sono n soluzioni reali dell’equazione <strong>di</strong>fferenziale omogenea linearmente in<strong>di</strong>pendenti.<br />
Scritto in forma meno compatta, vuol <strong>di</strong>re che se l’equazione caratteristica ha n ra<strong>di</strong>ci,<br />
in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si<br />
hanno le seguenti soluzioni per l’equazione lineare:<br />
G dalle ra<strong>di</strong>ci reali del polinomio caratteristico si hanno i seguenti integrali:<br />
e γ1x xe γ1x x 2 e γ1x . . . x r1−1 e γ1x<br />
e γ2x xe γ2x x 2 e γ2x . . . x r2−1 e γ2x<br />
e γ3x xe γ3x x 2 e γ3x . . . x r3−1 e γ3x<br />
. . . . . . .<br />
e γ hx<br />
xe γ hx<br />
x 2 e γ hx<br />
. . . x rh−1 e γ hx<br />
G dalle ra<strong>di</strong>ci complesse e coniugate del polinomio caratteristico si hanno i seguenti<br />
integrali:<br />
e α1x cos (β 1 x) e α1x sin (β 1 x) xe α1x cos (β 1 x) xe α1x sin (β 1 x)<br />
x 2 e α1x cos (β 1 x) x 2 e α1x sin (β 1 x) . . . . . .<br />
. . . . . . x s1−1 e α1x cos (β 1 x) x s1−1 e α1x sin (β 1 x)<br />
e α2x cos (β 2 x) e α2x sin (β 2 x) xe α2x cos (β 2 x) xe α2x sin (β 2 x)<br />
x 2 e α2x cos (β 2 x) x 2 e α2x sin (β 2 x) . . . . . .<br />
. . . . . . x s2−1 e α2x cos (β 2 x) x s2−1 e α2x sin (β 2 x)<br />
e α3x cos (β 3 x) e α3x sin (β 3 x) xe α3x cos (β 3 x) xe α3x sin (β 3 x)<br />
x 2 e α3x cos (β 3 x) x 2 e α3x sin (β 3 x) . . . . . .<br />
. . . . . . x s3−1 e α3x cos (β 3 x) x s3−1 e α3x sin (β 3 x)<br />
.<br />
.<br />
.<br />
.<br />
e αkx cos (β k x) e αkx sin (β k x) xe αkx cos (β k x) xe αkx sin (β k x)<br />
x 2 e αkx cos (β k x) x 2 e αkx sin (β k x) . . . . . .<br />
. . . . . . x sk−1 e αkx cos (β k x) x sk−1 e αkx sin (β k x)<br />
L’integrale generale è dato da una combinazione lineare <strong>di</strong> tutte queste soluzioni particolari.<br />
Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale omogenea è dato dalle combinazioni<br />
lineari delle soluzioni linearmente in<strong>di</strong>pendenti trovate.<br />
Esempio<br />
Es. 8.11.2 Sia data l’equazione lineare omogenea y ′′ − 4y = 0.<br />
L’equazione caratteristica è data da P (z) = z 2 − 4 = 0<br />
Le ra<strong>di</strong>ci <strong>di</strong> questa equazione sono date da z 1 = 2, z 2 = −2. Sono due ra<strong>di</strong>ci reali, con<br />
molteplicità uno.<br />
L’integrale generale dell’equazione <strong>di</strong>fferenziale è dunque dato da<br />
y(x) = c 1 e 2x + c 2 e −2x<br />
134
8.12. Metodo dei coefficienti indeterminati<br />
Esempio<br />
Es. 8.11.3 Sia ora y ′′ + 2y ′ + y = 0. Ora l’equazione caratteristica è data da P (z) =<br />
z 2 + 2z + 1 = 0, che ha come ra<strong>di</strong>ci z = −1 con molteplicità doppia.<br />
In tal caso l’integrale generale è dato da<br />
Esempio<br />
y(x) = c 1 e −x + c 2 xe −x<br />
Es. 8.11.4 Sia data l’equazione <strong>di</strong>fferenziale y ′′ + 2y ′ + 3 = 0. Adesso si ha, per l’equazione<br />
caratteristica, P (z) = z 2 + 2z + 3 = 0 che ha due ra<strong>di</strong>ci complesse e coniugate<br />
z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2. La parte reale è a = −1 la parte complessa è b = √ 2, quin<strong>di</strong><br />
l’integrale generale è<br />
y(x) = c 1 e −x cos ( √ 2x) + c 2 e −x sin ( √ 2x)<br />
Se, invece, interessa la soluzione generale dell’equazione <strong>di</strong>fferenziale non omogenea,<br />
dobbiamo trovare, oltre all’integrale generale dell’omogenea associata, anche un integrale<br />
particolare dell’equazione non omogenea visto che l’integrale generale è dato dalla somma<br />
dell’integrale generale dell’omogenea associata e dell’integrale particolare della non<br />
omogenea (in base al teorema 8.10.1).<br />
Il problema <strong>di</strong> trovare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale non omogenea<br />
L(y) = b(x) si riconduce alla soluzione <strong>di</strong> due problemi:<br />
1. trovare l’integrale generale dell’equazione omogenea associata L(y) = 0<br />
2. trovare un integrale particolare dell’equazione non omogenea L(y) = b(x)<br />
8.12 Metodo dei coefficienti indeterminati<br />
Per alcune funzioni b(x) è possibile trovare l’integrale particolare in modo abbastanza<br />
semplice, applicando il cosiddetto metodo dei coefficienti indeterminati. Ecco un elenco <strong>di</strong><br />
possibili casi per b(x).<br />
G Sia b(x) = P (x), un polinomio <strong>di</strong> grado p. Se nell’equazione <strong>di</strong>fferenziale, a 0 ≠ 0 , allora<br />
come soluzione particolare si ha y = Q(x), dove Q(x) è un polinomio <strong>di</strong> grado al più<br />
p (si va a cercare un polinomio dello stesso grado del termine noto che sia soluzione<br />
particolare dell’equazione non omogenea).<br />
G Se b(x) = P (x) polinomio <strong>di</strong> grado p, ma a 0 = a 1 = . . . = a r−1 = 0 con r − 1 ≤ n − 1<br />
(ciò equivale a <strong>di</strong>re che nell’equazione caratteristica associata si ha la ra<strong>di</strong>ce z = 0 con<br />
molteplicità r) allora si ha come soluzione particolare y = x r Q(x) polinomio <strong>di</strong> grado al<br />
più p.<br />
G Sia b(x) = e αx P (x) con α ∈ R e P (x) polinomio <strong>di</strong> grado p,<br />
– Se α non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx Q(x), con Q(x) polinomio <strong>di</strong><br />
grado al più p.<br />
– Se α è ra<strong>di</strong>ce dell’eq. caratteristica, con molteplicità r, allora y = x r e αx Q(x) con<br />
Q(x) polinomio <strong>di</strong> grado al più p.<br />
G Sia b(x) = e αx cos(βx)P (x) oppure b(x) = e αx sin(βx)P (x) oppure b(x) = e αx (cos(βx) +<br />
sin(βx))P (x), con α, β ∈ R e P (x) polinomio <strong>di</strong> grado p<br />
– Se α ± iβ non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx (cos(βx)Q 1 (x) +<br />
sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />
– Se α ± iβ è ra<strong>di</strong>ce dell’eq. caratteristica con molteplicità r, allora y =<br />
x r e αx (cos(βx)Q 1 (x) + sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />
Se il termine noto b(x) è dato dalla somma <strong>di</strong> funzioni, ciascuna delle quali si può ricondurre<br />
ad uno dei casi descritti sopra, allora l’integrale particolare è dato dalla somma <strong>degli</strong><br />
integrali particolari delle equazioni <strong>di</strong>fferenziali non omogenee legate a ciascun addendo<br />
135
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
della funzione <strong>di</strong> partenza. Infatti, se il termine noto è dato dalla somma <strong>di</strong> m funzioni,<br />
b(x) = b 1 (x)+b 2 (x)+. . .+b m (x), possiamo considerare sia l’equazione <strong>di</strong>fferenziale L(y) = b(x),<br />
sia le m equazioni <strong>di</strong>fferenziali L(y) = b 1 (x), L(y) = b 2 (x), . . . L(y) = b m (x).<br />
Siano y 1 , y 2 , . . . , y m m soluzioni particolari <strong>di</strong> queste m equazioni <strong>di</strong>fferenziali, allora vale<br />
L(y 1 + y 2 + . . . y m ) = L(y 1 ) + L(y 2 ) + . . . + L(y m )<br />
b 1 (x) + b 2 (x) + . . . + b m (x)<br />
= b(x)<br />
Quin<strong>di</strong> y = y 1 + y 2 + . . . + y m è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />
Ve<strong>di</strong>amo <strong>degli</strong> esempi sulla risoluzioni <strong>di</strong> equazioni <strong>di</strong>fferenziali non omogenee.<br />
Esempio<br />
Es. 8.12.1 Si voglia risolvere l’equazione <strong>di</strong>fferenziale<br />
y ′′ + y = 3x 2<br />
Per prima cosa risolviamo l’omogenea associata y ′′ + y = 0. L’equazione caratteristica è :<br />
z 2 + 1 = 0, da cui z = ±i: abbiamo due ra<strong>di</strong>ci complesse e coniugate. L’integrale generale<br />
è, dunque: y = c 1 cos (x) + c 2 sin (x).<br />
Cerchiamo ora un integrale particolare. Ve<strong>di</strong>amo che b(x) = 3x 2 , è un polinomio <strong>di</strong> secondo<br />
grado, e il coefficiente a 0 dell’equazione <strong>di</strong>fferenziale è <strong>di</strong>verso da zero. Quin<strong>di</strong><br />
l’integrale particolare deve essere un polinomio <strong>di</strong> secondo grado, del tipo y = ax 2 +bx+c,<br />
con a, b, c da determinare andando a sostituire y nell’equazione <strong>di</strong>fferenziale. Infatti deve<br />
essere<br />
y ′′ + y = 3x 2<br />
Da y = ax 2 + bx + c, si ha y ′ = 2ax + b e y ′′ = 2a. Andando a sostituire nell’equazione<br />
<strong>di</strong>fferenziale si ricava:<br />
2a + ax 2 + bx + c = 3x 2<br />
Ora i termini che hanno le stesse potenze <strong>di</strong> x a primo e a secondo membro vanno<br />
eguagliati:<br />
⎧<br />
⎪⎨ ax 2 = 3x 2<br />
bx = 0<br />
⎪⎩<br />
2a + c = 0<br />
Risolviamo questo sistema <strong>di</strong> 3 equazioni in 3 incognite, ottenendo a = 3, b = 0, c = −2a =<br />
−6. Perciò l’integrale particolare è dato da y = 3x 2 − 6.<br />
L’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea vale dunque: y =<br />
c 1 cos (x) + c 2 sin (x) + 3x 2 − 6.<br />
Esempio<br />
Es. 8.12.2 Sia da risolvere l’equazione <strong>di</strong>fferenziale<br />
y ′′ + 3y ′ + 2y = x + x 3 − e −x sin (2x)<br />
Per prima cosa cerchiamo le soluzioni dell’equazione omogenea associata. L’equazione<br />
caratteristica è : z 2 + 3z + 2 = 0, da cui le ra<strong>di</strong>ci reali z 1 = −1 e z 2 = −2. L’integrale<br />
generale dell’omogenea è dunque y = c 1 e −x + c 2 e −2x .<br />
136
8.12. Metodo dei coefficienti indeterminati<br />
Consideriamo ora il termine noto b(x) = x+x 3 −e −x sin (2x). Osserviamo come il termine<br />
noto possa essere visto come somma del polinomio P (x) = x + x 3 e della funzione<br />
−e −x sin (2x).<br />
Cerchiamo dunque un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />
y ′′ + 3y ′ + 2y = x + x 3<br />
e un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />
y ′′ + 3y ′ + 2y = −e −x sin (2x)<br />
Per il primo integrale, ve<strong>di</strong>amo che il termine noto è un polinomio <strong>di</strong> terzo grado e<br />
che il coefficiente a 0 ≠ 0, quin<strong>di</strong> l’integrale particolare è un polinomio <strong>di</strong> terzo grado<br />
y = ax 3 + bx 2 + cx + d. Derivando, si ha y ′ = 3ax 2 + 2bx + c e y ′′ = 6ax + 2b. Andando a<br />
sostituire nell’equazione <strong>di</strong>fferenziale si ha<br />
6ax + 2b + 3(3ax 2 + 2bx + c) + 2(ax 3 + bx 2 + cx + d) = x + x 3<br />
Raccogliendo i termini con le stesse potenze <strong>di</strong> x a primo membro, abbiamo<br />
2ax 3 + (9a + 2b)x 2 + (6a + 6b + 2c)x + 2b + 3c + 2d = x + x 3<br />
Uguagliando i termini con le stesse potenze a primo e a secondo membro si ha:<br />
⎧<br />
2a = 1<br />
⎪⎨<br />
9a + 2b = 0<br />
6a + 6b + 2c = 1<br />
⎪⎩<br />
2b + 3c + 2d = 0<br />
Otteniamo a = 1/2, b = − 9 2 a = −9 1 − 6a − 6b<br />
, c =<br />
4 2<br />
y = x3<br />
2 − 9 4 x2 + 23 4 x − 51<br />
8 .<br />
= 23 4<br />
, d =<br />
−2b − 3c<br />
2<br />
= − 51 , da cui<br />
8<br />
Passiamo ora a trovare un integrale particolare per la seconda equazione <strong>di</strong>fferenziale<br />
che abbiamo ricavato che ha come termine noto la funzione −e −x sin (2x). Riconducendoci<br />
allo schema che abbiamo fatto per i vari casi <strong>di</strong> termini noto, questo si<br />
riconduce alla funzione del tipo e αx sin (βx)P (x), dove α = −1, β = 2, P (x) = −1 (polinomio<br />
<strong>di</strong> grado 0). Poichè −1 ± i2 non è ra<strong>di</strong>ce dell’equazione caratteristica (che ha<br />
nel nostro caso solo ra<strong>di</strong>ci reali), dobbiamo cercare un integrale particolare del tipo<br />
y = e −x (cos (2x)a + sin (2x)b) (devono essere Q 1 eQ 2<br />
costanti).<br />
Allora,<br />
y ′ = −e −x (a cos (2x) + b sin (2x)) + e −x (−2a sin (2x) + 2b cos (2x))<br />
= e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))<br />
polinomi <strong>di</strong> grado zero, cioè delle<br />
y ′′ = −e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />
e −x (−2(2b − a) sin (2x) − 2(b + 2a) cos (2x))<br />
= e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))<br />
137
8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />
Andando a sostituire nell’equazione <strong>di</strong>fferenziale, si ottiene:<br />
e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))+<br />
3(e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />
2(e −x (a cos (2x) + b sin (2x)) = −e −x sin (2x)<br />
Si può semplificare l’equazione <strong>di</strong>videndo ambo i membri per e −x .<br />
termini in sin (2x) e cos (2x) si ha:<br />
Raccogliendo i<br />
(2b − 4a) cos (2x) + (−4b − 2a) sin (2x) = − sin (2x)<br />
Quin<strong>di</strong>:<br />
{<br />
2b − 4a = 0<br />
−4b − 2a = −1<br />
Risolvendo il sistema si trova a = 1<br />
10 e b = 1 5 da cui y = e−x ( 1<br />
10 cos (2x) + 1 sin (2x)).<br />
5<br />
Concludendo, l’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea da cui<br />
siamo partiti è dato da:<br />
y = c 1 exp −x + c 2 exp −2x + x3<br />
2 − 9 4 x2 + 23 4 x − 51 8 + e−x ( 1<br />
10 cos (2x) + 1 sin (2x))<br />
5<br />
Se si ha un problema <strong>di</strong> Cauchy, si risolve prima l’equazione <strong>di</strong>fferenziale cercando un<br />
integrale generale. Successivamente, le costanti vengono determinate in base alle con<strong>di</strong>zioni<br />
iniziali date dal problema.<br />
138
CAPITOLO 9<br />
Forme <strong>di</strong>fferenziali<br />
Nel campo della matematica,<br />
se trovo un nuovo approccio a<br />
un problema, ci può essere<br />
sempre un altro matematico<br />
che sostiene <strong>di</strong> aver trovato<br />
una soluzione migliore, o<br />
semplicemente più elegante.<br />
Negli scacchi se qualcuno<br />
sostiene <strong>di</strong> essere più bravo <strong>di</strong><br />
me, io gli posso sempre dare<br />
scaccomatto.<br />
Emanuel Lasker (1868-1941)<br />
9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />
9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />
9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />
9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . . 144<br />
9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />
9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />
9.1 Introduzione alle forme <strong>di</strong>fferenziali<br />
Consideriamo una curva regolare γ nel piano data da equazioni parametriche<br />
x = x(t), y = y(t), a ≤ t ≤ b<br />
Sia data una funzione f(x, y) <strong>di</strong>pendente da due variabili. Possiamo pensare <strong>di</strong> integrare la<br />
funzione f sulla curva γ rispetto a x o rispetto a y (quin<strong>di</strong> non sull’arco <strong>di</strong> curva, ds, ma in<br />
dx o dy).<br />
Si ha l’integrale curvilineo <strong>di</strong> f rispetto a x dato da<br />
∫<br />
γ<br />
f(x, y)dx =<br />
∫ b<br />
a<br />
f(x(t), y(t))x ′ (t)dt<br />
Si ha l’integrale curvilineo <strong>di</strong> f rispetto a y dato da<br />
∫<br />
γ<br />
f(x, y)dy =<br />
∫ b<br />
a<br />
f(x(t), y(t))y ′ (t)dt<br />
139
9. FORME DIFFERENZIALI<br />
Infatti poichè x = x(t), allora dx = x ′ (t)dt. Analogo è il ragionamento per la y.<br />
Spesso questi due integrali appaiono insieme: se X e Y sono due funzioni nelle variabili<br />
x e y e se γ è una curva (data da equazioni parametriche come in precedenza), allora<br />
∫<br />
∫ b<br />
Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />
γ<br />
=<br />
=<br />
a<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
X(x(t), y(t))x ′ (t)dt + Y (x(t), y(t))y ′ (t)dt<br />
(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />
L’espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome <strong>di</strong><br />
forma <strong>di</strong>fferenziale.<br />
Possiamo dare allora la seguente definizione<br />
Definizione 9.1.1 Date X e Y due funzioni definite in I ⊂ R 2 , si chiama forma <strong>di</strong>fferenziale<br />
lineare ω (o forma lineare) l’espressione<br />
ω = Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />
Le funzioni X e Y si chiamano coefficienti della forma <strong>di</strong>fferenziale.<br />
Se i coefficienti sono <strong>di</strong> classe C p , la forma <strong>di</strong>fferenziale si <strong>di</strong>ce <strong>di</strong> classe C p .<br />
Per una forma <strong>di</strong>fferenziale, si possono definire le seguenti operazioni:<br />
G dato un vettore r = (r 1 , r 2 ) e (x, y) ∈ I, il prodotto scalare tra ω e r è:<br />
ω · r = X(x, y)r 1 + Y (x, y)r 2<br />
G dato uno scalare c ∈ R e una funzione f definita in I e a valori in R si definisce la<br />
moltiplicazione della forma <strong>di</strong>fferenziale per c e per f nel modo seguente:<br />
cω = cXdx + cY dy<br />
fω = (fX)dx + (fY )dy<br />
G Date due forme <strong>di</strong>fferenziali ω 1 e ω 2 , si definisce ad<strong>di</strong>zione <strong>di</strong> ω 1 e <strong>di</strong> ω 2 la seguente<br />
forma:<br />
ω 1 + ω 2 = (X 1 dx + Y 1 dy) + (X 2 dx + Y 2 dy) = (X 1 + X 2 )dx + (Y 1 + Y 2 )dy<br />
Con queste operazione, l’insieme delle forme <strong>di</strong>fferenziali lineari, definite in un insieme I ⊂ R,<br />
è uno spazio vettoriale.<br />
Consideriamo, ora, il <strong>di</strong>fferenziale <strong>di</strong> una funzione f(x, y). Si ha df = f x dx+f y dy. Quin<strong>di</strong> il<br />
<strong>di</strong>fferenziale <strong>di</strong> una funzione f si può vedere come una forma <strong>di</strong>fferenziale lineare. Non vale,<br />
ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui<br />
<strong>di</strong>fferenziale coincida con la forma lineare stessa.<br />
9.2 Integrali delle forme <strong>di</strong>fferenziali<br />
Abbiamo introdotto le forme <strong>di</strong>fferenziali introducendo <strong>degli</strong> integrali curvilinei fatti rispetto<br />
a x e rispetto a y. Le forme <strong>di</strong>fferenziali, infatti, vengono utilizzate in integrali<br />
curvilinei.<br />
Data una curva regolare γ con il suo orientamento naturale, quin<strong>di</strong> una curva +γ, che<br />
puó essere scritta in forma parametrica tramite le equazioni<br />
140<br />
x = x(t), y = y(t), a ≤ t ≤ b
9.2. Integrali delle forme <strong>di</strong>fferenziali<br />
si definisce integrale curvilineo (o <strong>di</strong> linea) della forma <strong>di</strong>fferenziale ω sulla curva +γ,<br />
l’integrale<br />
∫ ∫<br />
∫ b<br />
ω = Xdx + Y dy = (X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />
+γ<br />
+γ<br />
a<br />
Se scriviamo le equazioni parametriche della curva usando una funzione vettoriale f =<br />
(x(t), y(t)), l’integrale <strong>di</strong> prima può essere scritto come<br />
∫ ∫ b<br />
ω = ω(f(t)) · f ′ (t)dt<br />
+γ<br />
a<br />
Difatti il prodotto scalare ω(f(t)) · f ′ (t) altro non è che la funzione integranda che abbiamo<br />
scritto prima X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t).<br />
Ora cerchiamo <strong>di</strong> vedere cosa succede se facciamo l’integrale <strong>di</strong> una forma <strong>di</strong>fferenziale<br />
su una curva +γ o sulla curva opposta −γ. Ve<strong>di</strong>amolo con un esempio.<br />
Esempio<br />
Es. 9.2.1 Sia ω = yx 2 dx + sin (πy)dy. Quin<strong>di</strong> X(x, y) = yx 2 , e Y (x, y) = sin (πy).<br />
La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4).<br />
La curva +γ in forma parametrica può essere scritta come<br />
x = t, y = 2t + 2, 0 ≤ t ≤ 1<br />
Per t = 0 si ha (0, 2), per t = 1 si ha (1, 4).<br />
Calcoliamo ∫ +γω. Si ha<br />
∫<br />
+γ<br />
ω =<br />
=<br />
∫ 1<br />
0<br />
∫ 1<br />
0<br />
(<br />
y(t)x(t) 2 x ′ (t) + sin (πy(t))y ′ (t) ) ∫ 1<br />
(<br />
dt = (2t + 2)t 2 + sin (π(2t + 2))2 ) dt<br />
(<br />
2t 3 + 2t 2 + 2 sin (π(2t + 2)) ) dt = 2 t4 4 + 2t3 3 − 1 π<br />
= 1 2 + 2 3 − 1 π + 1 π = 7 6<br />
0<br />
cos (π(2t + 2))|t=1 t=0<br />
Ve<strong>di</strong>amo ora cosa succede se integriamo lungo la curva opposta −γ (ricor<strong>di</strong>amo che quando<br />
abbiamo definito l’integrale curvilineo <strong>di</strong> una funzione lungo una curva γ, integrando<br />
lungo la curva, cioè rispetto all’ascissa curvilinea ds, abbiamo detto che l’integrale non<br />
<strong>di</strong>pende dall’orientamento della curva. In questo caso invece, le cose cambiano):<br />
La curva opposta −γ ha equazioni parametriche<br />
x = −t, y = −2t + 2, −1 ≤ t ≤ 0<br />
Per t = −1 si ha (1, 4), per t = 0 si ha (0, 2).<br />
Si ha dunque<br />
∫<br />
−γ<br />
ω =<br />
=<br />
∫ 0<br />
−1<br />
∫ 0<br />
−1<br />
yx 2 dx + sin (πy)dy =<br />
∫ 0<br />
−1<br />
(<br />
(−2t + 2)(−t) 2 (−1) + sin (π(−2t + 2))(−2) ) dt<br />
(<br />
2t 3 − 2t 2 − 2 sin (π(−2t + 2)) ) dt = 2 t4 4 − 2t3 3 − 1 π<br />
= − 1 π − 1 2 − 2 3 + 1 π = −7 6<br />
cos (π(−2t + 2))|t=0 t=−1<br />
Osserviamo dunque che il valore dell’integrale che abbiamo ottenuto sulla curva opposta<br />
−γ è l’opposto dell’integrale che avevamo ottenuto sulla curva +γ.<br />
141
9. FORME DIFFERENZIALI<br />
Vale infatti il seguente teorema<br />
Teorema 9.2.1 Data una forma <strong>di</strong>fferenziale ω e una curva regolare +γ si ha<br />
∫ ∫<br />
ω = − ω<br />
−γ<br />
+γ<br />
Dimostrazione. Dimostriamo questo teorema considerando che se una curva +γ è data<br />
da f = (x(t), y(t)) con a ≤ t ≤ b, la curva opposta si può scrivere come −γ con F = (˜x(t), ỹ(t)) =<br />
(x(−t), y(−t)) con −b ≤ t ≤ −a Quin<strong>di</strong> ˜x ′ (t) è uguale alla derivata della funzione x(−t) che va<br />
vista come la funzione composta x(h(t)) con h(t) = −t. Derivando, quin<strong>di</strong>, si ha la derivata <strong>di</strong><br />
x valutata in h(t) = −t per la derivata <strong>di</strong> h(t) che vale −1, da cui: ˜x ′ (t) = x ′ (−t)(−1) = −x ′ (−t).<br />
Analogamente, vale ỹ(−t) = −y ′ (−t).<br />
Allora<br />
∫ ∫ −a<br />
ω = (X(˜x(t), ỹ(t))˜x ′ (t) + Y (˜x(t), ỹ(t)), ỹ ′ (t)) dt<br />
−γ<br />
=<br />
=<br />
−b<br />
∫ −a<br />
−b<br />
∫ −a<br />
−b<br />
(X(x(−t), y(−t))(−x ′ (−t)) + Y (x(−t), y(−t)), (−y ′ (−t))) dt<br />
− (X(x(−t), y(−t))x ′ (−t) + Y (x(−t), y(−t))y ′ (−t)) dt<br />
facendo il cambiamento <strong>di</strong> variabili u = −t, du = −dt<br />
e considerando che per t = −b, u = b, e per t = −a, u = a<br />
=<br />
∫ a<br />
b<br />
∫ b<br />
= −<br />
∫<br />
= −<br />
(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />
a<br />
+γ<br />
(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />
ω<br />
✔<br />
Quin<strong>di</strong> nel fare gli integrali curvilinei delle forme <strong>di</strong>fferenziali occorre prestare molta attenzione<br />
all’orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme<br />
<strong>di</strong>fferenziali sono detti integrali orientati.<br />
Invece, anche per le forme <strong>di</strong>fferenziali, l’integrale curvilineo non <strong>di</strong>pende dal tipo <strong>di</strong><br />
rappresentazione utilizzata per la curva, cioè non <strong>di</strong>pende dalla scelta della rappresentazione<br />
parametrica.<br />
Si ha infatti la seguente proposizione<br />
Proposizione 9.2.1 L’integrale curvilineo ∫ ω non <strong>di</strong>pende dalla particolare rappresentazione<br />
della curva regolare<br />
+γ<br />
+γ.<br />
Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a ≤ t ≤ b o,<br />
in maniera equivalente, tramite la funzione F = (x F (u), y F (u)), con α ≤ u ≤ β . Sappiamo che,<br />
dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro me<strong>di</strong>ante<br />
una funzione φ : [α, β] ⇒ [a, b] con φ ′ (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f(φ(u))<br />
Torniamo all’integrale curvilineo. Da una parte<br />
∫<br />
+γ<br />
ω =<br />
∫ b<br />
a<br />
(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />
142
9.3. Applicazione delle forme <strong>di</strong>fferenziali<br />
Dall’altra si ha:<br />
∫ ∫ β<br />
ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />
+γ<br />
α<br />
Ma per la relazione che lega F a f si ha:<br />
F(u) = f(φ(u))<br />
(x F (u), y F (u)) = (x(φ(u), y(φ(u))<br />
+γ<br />
x ′ F (u) = x ′ (φ(u))φ ′ (u)<br />
y ′ F (u) = y ′ (φ(u))φ ′ (u)<br />
Quin<strong>di</strong> si ha<br />
∫ ∫ β<br />
ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />
=<br />
α<br />
∫ β<br />
α<br />
(X(x(φ(u)), y(φ(u)))x ′ (φ(u))φ ′ (u) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))φ ′ (u)) du<br />
mettendo in evidenza φ ′ (u)<br />
=<br />
∫ β<br />
α<br />
(X(x(φ(u)), y(φ(u)))x ′ (φ(u)) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))) φ ′ (u)du<br />
operando il cambiamento <strong>di</strong> variabili t = φ(u)<br />
e considerando dt = φ ′ (u)du<br />
e il cambiamento agli estremi u = α ⇒ t = a, u = β ⇒ t = b<br />
=<br />
∫ b<br />
a<br />
(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />
Abbiamo provato che la rappresentazione parametrica della curva non influisce sul risultato<br />
finale perchè gli integrali coincidono qualunque sia la rappresentazione parametrica per<br />
descrivere la stessa curva. ✔<br />
Per gli integrali curvilinei sulle forme <strong>di</strong>fferenziali valgono anche le seguenti proprietà:<br />
G se c ∈ R, ∫ +γ cω = c ∫ +γ ω<br />
G ∫ +γ ω 1 + ω 2 = ∫ +γ ω 1 + ∫ +γ ω 2<br />
G se la curva +γ viene sud<strong>di</strong>visa in un certo numero k <strong>di</strong> curve regolari, tali che +γ =<br />
+γ 1 ∪+γ 2 ∪. . .∪+γ k o se la curva è regolare a tratti, allora ∫ +γ ω = ∫ +γ 1<br />
ω+ ∫ +γ 2<br />
ω+. . .+ ∫ +γ k<br />
ω<br />
9.3 Applicazione delle forme <strong>di</strong>fferenziali<br />
In molte applicazioni soprattutto nella fisica, ci si trova a lavorare con funzioni vettoriali<br />
da integrare su curve. Sia F ⃗ = X(x, y)⃗i + Y (x, y)⃗j una funzione vettoriale (scritta in funzione<br />
dei versori <strong>degli</strong> assi x e y rispettivamente). Sia data una curva regolare +γ data da ⃗r =<br />
x(t)⃗i + y(t)⃗j (è la stessa cosa <strong>di</strong> scrivere f = (x(t), y(t)))) con a ≤ t ≤ b.<br />
Si definisce integrale curvilineo del vettore F ⃗ lungo la curva +γ l’integrale<br />
∫<br />
∫ b<br />
⃗F · d⃗r = ⃗F (⃗r) · ⃗r ′ (t)dt<br />
+γ<br />
a<br />
Poichè F ⃗ (⃗r) = F ⃗ (x(t), y(t)) = X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j e ⃗r ′ (t) = x ′ (t)⃗i + y ′ (t)⃗j, risulta<br />
∫<br />
∫ b<br />
⃗F · d⃗r = (X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j) · (x ′ (t)⃗i + y ′ (t)⃗j)dt<br />
+γ<br />
=<br />
a<br />
∫ b<br />
a<br />
(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />
143
9. FORME DIFFERENZIALI<br />
Abbiamo ritrovato la definizione <strong>di</strong> integrale curvilineo <strong>di</strong> una forma <strong>di</strong>fferenziale, dove i<br />
coefficienti della forma <strong>di</strong>fferenziale sono le componenti del vettore ⃗ F .<br />
Un esempio in cui ve<strong>di</strong>amo applicata una forma <strong>di</strong>fferenziale in fisica è il lavoro compiuto<br />
da un campo <strong>di</strong> forze. Se consideriamo una particella che si muove lungo una curva, in<strong>di</strong>cando<br />
con ⃗s la <strong>di</strong>stanza percorsa dalla particella lungo la curva +γ, e con ⃗ F = (X, Y ) una<br />
forza che agisce sulla particella mentre essa si sposta <strong>di</strong> d⃗s, si definisce lavoro elementare<br />
eseguito da ⃗ F il prodotto scalare:<br />
dL = ⃗ F · d⃗s<br />
In coor<strong>di</strong>nate cartesiane, e limitandoci al caso bi<strong>di</strong>mensionale, si può scrivere<br />
dL = Xdx + Y dy<br />
Il lavoro elementare è dunque una forma <strong>di</strong>fferenziale.<br />
Il lavoro totale lungo tutta la curva +γ è invece definito tramite l’integrale della forma<br />
<strong>di</strong>fferenziale dL:<br />
∫ ∫ b<br />
L = dL = X(x(t), y(t))dx + Y (x(t), y(t))dy<br />
+γ<br />
a<br />
9.4 Teorema fondamentale per gli integrali curvilinei<br />
Teorema 9.4.1 Assegnata una funzione f(x, y), si consideri la forma <strong>di</strong>fferenziale data dal<br />
suo <strong>di</strong>fferenziale: ω = df = f x dx + f y dy.<br />
Data una curva regolare +γ espressa me<strong>di</strong>ante rappresentazione parametrica da (x(t), y(t))<br />
(o me<strong>di</strong>ante la funzione vettoriale ⃗r) , si ha<br />
∫<br />
df = f(x(b), y(b)) − f(x(a), y(a))<br />
✔<br />
+γ<br />
Questo risultato equivale anche a <strong>di</strong>re che<br />
∫<br />
∇f · d⃗r = f(x(b), y(b)) − f(x(a), y(a))<br />
+γ<br />
Dimostrazione.<br />
Si ha<br />
∫ ∫ b<br />
df = (f x (x(t), y(t))x ′ (t) + f y (x(t), y(t))y ′ (t)) dt<br />
+γ<br />
a<br />
per le regole <strong>di</strong> derivazione delle funzioni composte<br />
=<br />
∫ b<br />
a<br />
df(x(t), y(t))<br />
dt<br />
dt<br />
= f(x(t), y(t))| t=b<br />
t=a<br />
= f(x(b), y(b)) − f(x(a), y(a))<br />
9.5 Forme <strong>di</strong>fferenziali lineari esatte<br />
Definizione 9.5.1 Una forma <strong>di</strong>fferenziale ω = Xdx + Y dy (definita in un insieme aperto e <strong>di</strong><br />
classe C 0 ) si <strong>di</strong>ce esatta se esiste almeno una funzione F (<strong>di</strong> classe C 1 ) tale che dF = ω vale a<br />
<strong>di</strong>re se F x = X e F y = Y .<br />
144
9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />
Figura 9.1: A, B e C sono esempi <strong>di</strong> insiemi connessi.<br />
Figura 9.2: L’insieme A costituito dall’unione dei tre insiemi non è un insieme connesso.<br />
Si <strong>di</strong>ce anche che F è una primitiva <strong>di</strong> ω.<br />
Ve<strong>di</strong>amo ora un particolare tipo <strong>di</strong> insieme che ci permette <strong>di</strong> stabilire alcune importanti<br />
proprietà per le forme <strong>di</strong>fferenziali, se definite su questi insiemi. Si tratta <strong>degli</strong> insiemi<br />
connessi.<br />
Definizione 9.5.2 Un insieme aperto A ⊂ R 2 si <strong>di</strong>ce connesso se, qualunque siano i punti P<br />
e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come<br />
estremi.<br />
Per funzioni definite su insiemi connessi vale questo Lemma.<br />
Lemma 9.5.1 Sia f una funzione <strong>di</strong> classe C 1 definita in un insieme aperto e connesso A <strong>di</strong><br />
R 2 . Se, per ogni (x, y) ∈ A risulta f x (x, y) = f y (x, y) = 0, allora f è una funzione costante in A.<br />
145
9. FORME DIFFERENZIALI<br />
Dimostrazione. Consideriamo due punti, P = (x, y) e P 0 = (x 0 , y 0 ) in A. Dalla definizione<br />
<strong>di</strong> insieme connesso, sappiamo che esiste una linea poligonale che congiunge P e P 0 e che<br />
si trova all’interno <strong>di</strong> A. Per semplicità supponiamo che la linea poligonale sia il segmento<br />
congiungente i due punti. Allora, per il teorema <strong>di</strong> Lagrange, si ha<br />
f(P ) = f(P 0 ) + f x (Q)(x − x 0 ) + f y (Q)(y − y 0 )<br />
con Q punto che non conosciamo, che si trova sul segmento congiungente P e P 0 . Poichè<br />
f x (Q) = f y (Q) = 0 (e questo qualunque sia il punto Q), si ha<br />
f(P ) = f(P 0 )<br />
Possiamo variare il punto P , lasciando fisso P 0 ma avremo sempre lo stesso risultato, quin<strong>di</strong><br />
la funzione assume valore costante.<br />
Se, al posto <strong>di</strong> un segmento congiungente P e P 0 , abbiamo una linea spezzata, si ripete il<br />
ragionamento su ciascun segmento arrivando alla stessa conclusione. ✔<br />
Per le forme <strong>di</strong>fferenziali, vale il seguente lemma.<br />
Lemma 9.5.2 Se F e G sono primitive, <strong>di</strong> classe C 1 , definite in un insieme aperto e connesso,<br />
della stessa forma <strong>di</strong>fferenziale lineare ω, allora <strong>di</strong>fferiscono per una costante.<br />
Dimostrazione. Poichè, per ipotesi, F e G sono primitive <strong>di</strong> ω = Xdx + Y dy, vuol <strong>di</strong>re che<br />
F x = G x = X, F y = G y = Y . Consideriamo la funzione f = F − G. Questa funzione è definita<br />
in un insieme aperto e connesso (come la forma lineare) ed è <strong>di</strong> classe C 1 (essendolo F e G).<br />
Si ha f x = F x − G x = X − X = 0 e f y = F y − G y = Y − Y = 0, e questo qualunque sia (x, y) preso<br />
nell’insieme <strong>di</strong> definizione. Ma, allora, sono sod<strong>di</strong>sfatte le ipotesi del lemma precedente e<br />
quin<strong>di</strong> f è una funzione costante: f(x, y) = cost. Di conseguenza, F (x, y) − G(x, y) = cost, cioè<br />
F e G <strong>di</strong>fferiscono per una costante: F (x, y) = G(x, y) + cost. ✔<br />
Consideriamo ora i seguenti teoremi sulle forme <strong>di</strong>fferenziali lineari esatte.<br />
Teorema 9.5.1 Data ω = Xdx + Y dy una forma <strong>di</strong>fferenziale lineare, <strong>di</strong> classe C 0 e definita<br />
in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva <strong>di</strong> ω è del tipo<br />
F + cost con cost una costante.<br />
Dimostrazione. Se F è una primitiva <strong>di</strong> ω, la funzione G = F +cost è anch’essa primitiva,<br />
in quanto G x = F x = X e G y = F y = Y (poichè la derivata <strong>di</strong> una costante rispetto a x e a y<br />
vale zero).<br />
Supponendo <strong>di</strong> conoscere un’altra primitiva <strong>di</strong> ω, G, poichè si ha sempre G x = X e<br />
G y = Y , per il lemma precedente, si ha ancora che G e F <strong>di</strong>fferiscono per una costante,<br />
quin<strong>di</strong> G = F + cost. ✔<br />
L’insieme delle primitive <strong>di</strong> una forma <strong>di</strong>fferenziale lineare ω in un insieme aperto e connesso<br />
prende il nome <strong>di</strong> integrale indefinito, propriò perchè, nota una primitiva, tutte le altre<br />
<strong>di</strong>fferiscono per una costante.<br />
Teorema 9.5.2 Dato A ⊂ R 2 aperto e connesso e data una forma <strong>di</strong>fferenziale lineare ω <strong>di</strong><br />
classe C 0 in A, le seguenti proposizioni sono equivalenti:<br />
1. ω è esatta.<br />
2. Se P 0 e P sono due punti qualunque in A e +γ 1 e +γ 2 sono due curve generalmente<br />
regolari orientate contenute in A, che hanno entrambe come primo estremo P 0 e come<br />
secondo estremo P , allora<br />
∫ ∫<br />
ω = ω<br />
+γ 1 +γ 2<br />
146<br />
vale a <strong>di</strong>re l’integrale curvilineo <strong>di</strong>pende solo dagli estremi P 0 e P e non dal cammino<br />
percorso.
9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />
Figura 9.3: Le curve +γ 1 e +γ 2 hanno gli stessi estremi P 0 e P . La curva −γ 2 opposta a +γ 2<br />
ha come estremi P e P 0 .<br />
3. Se γ è una qualunque curva generalmente regolare, chiusa e contenuta in A, allora<br />
∫<br />
ω = 0<br />
+γ<br />
Dimostrazione. Di questo teorema, <strong>di</strong>mostriamo che (1) ⇒ (2), (2) ⇒ (3) e (3) ⇒ (2).<br />
(1) ⇒ (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P 0 e P in A e<br />
sia +γ una curva generalmente regolare che ha P 0 come primo estremo e P come secondo<br />
estremo. In forma parametrica, le equazioni della curva +γ siano<br />
x = x(t) y = y(t) a ≤ t ≤ b<br />
Quin<strong>di</strong> (x(a), y(a)) = (x 0 , y 0 ) = P 0 , e (x(b), y(b)) = (x, y) = P .<br />
Sia F una primitiva <strong>di</strong> ω (esiste perchè ω è esatta: vuol <strong>di</strong>re che dF = ω, poichè F x = X e<br />
F y = Y .<br />
Ma allora per il teorema fondamentale del calcolo <strong>degli</strong> integrali (si veda teorema 9.4.1)<br />
∫ ∫<br />
ω = dF = F (P ) − F (P 0 )<br />
+γ<br />
+γ<br />
L’integrale non <strong>di</strong>pende dalla particolare curva +γ ma solo dagli estremi della curva e dalla<br />
primitiva F . Perciò, date due curve +γ 1 e +γ 2 il risultato dell’integrale non cambia (si veda<br />
Figura 9.3). La (2) è provata.<br />
(2) ⇒ (3) Sia +γ una curva generalmente regolare chiusa data da equazioni<br />
parametriche<br />
x = x(t) y = y(t) a ≤ t ≤ b<br />
Si fissi un punto t ′ interno all’intervallo [a, b] e si considerino le due curve che si ottengono<br />
da +γ facendo variare il parametro t in [a, t ′ ] e in [t ′ , b] in modo che +γ sia dato dall’unione<br />
<strong>di</strong> queste due curve, che chiamiamo, rispettivamente +γ 1 e +γ 2 . La curva +γ 1 ha come<br />
primo estremo P 0 e come secondo estremo il punto T = (x(t ′ ), y(t ′ ). La curva +γ 2 ha come<br />
primo estremo T e come secondo estremo P 0 (essendo la curva chiusa e quin<strong>di</strong> (x(a), y(a)) =<br />
(x(b), y(b))).<br />
La curva opposta a +γ 2 è la curva −γ 2 e ha, quin<strong>di</strong>, come primo estremo P 0 e come<br />
secondo estremo T .<br />
Dunque, le curve +γ 1 e −γ 2 hanno gli stessi estremi P 0 e T . Ora, per l’ipotesi (2) sappiamo<br />
che ∫ ∫<br />
ω = ω<br />
+γ 1 −γ 2<br />
147
9. FORME DIFFERENZIALI<br />
Ma sappiamo anche che<br />
∫ ∫<br />
ω = −<br />
−γ 2<br />
Quin<strong>di</strong><br />
∫ ∫<br />
ω = −<br />
+γ 1<br />
+γ 2<br />
ω<br />
+γ 2<br />
ω<br />
da cui<br />
∫ ∫<br />
ω + ω = 0<br />
+γ 1 +γ 2<br />
Torniamo all’integrale su tutta la curva +γ: poichè +γ = +γ 1 ∪ +γ 2 si ha<br />
∫<br />
ω =<br />
+γ<br />
∫<br />
ω +<br />
+γ 1<br />
∫<br />
ω<br />
+γ 2<br />
Ma la somma <strong>di</strong> questi due integrali vale zero, quin<strong>di</strong><br />
∫<br />
ω = 0<br />
+γ<br />
L’asserto è dunque provato.<br />
(3) ⇒ (2) Siano date due curve +γ 1 e +γ 2 due curve generalmente regolari che hanno<br />
gli stessi estremi P 0 e P . Allora la curva +γ 1 ∪ −γ 2 è una curva chiusa generalmente regolare.<br />
Per la (3) vale<br />
∫<br />
+γ 1∪−γ 2<br />
ω = 0<br />
Ma<br />
∫ ∫ ∫<br />
ω = ω +<br />
+γ 1∪−γ 2 +γ 1<br />
Quin<strong>di</strong><br />
∫ ∫<br />
ω + ω = 0<br />
+γ 1 −γ 2<br />
−γ 2<br />
ω<br />
da cui<br />
∫ ∫ ∫ ∫<br />
ω = − ω ⇒ ω = ω<br />
+γ 1 −γ 2 +γ 1 +γ 2<br />
Abbiamo verificato il punto (2).<br />
Per completare la <strong>di</strong>mostrazione del teorema, andrebbe <strong>di</strong>mostrato che (2) ⇒ (1). Poichè<br />
la <strong>di</strong>mostrazione è abbastanza complicata, la tralasciamo. ✔<br />
Come corollario si ha<br />
Proposizione 9.5.1 Siano A ⊂ R 2 un insieme aperto e connesso e ω una forma <strong>di</strong>fferenziale<br />
lineare <strong>di</strong> classe C 0 in A, con F primitiva. Allora, se +γ è una curva generalmente regolare e<br />
orientata contenuta in A, che ha come primo estremo P 0 e come secondo estremo P , si ha<br />
∫<br />
ω = F (P ) − F (P 0 )<br />
+γ<br />
Dimostrazione.<br />
precedente. ✔<br />
148<br />
Questo risultato lo abbiamo <strong>di</strong>mostrato al punto (1) ⇒ (2) del teorema
9.6. Le forme <strong>di</strong>fferenziali lineari chiuse<br />
9.6 Le forme <strong>di</strong>fferenziali lineari chiuse<br />
Definizione 9.6.1 Una forma <strong>di</strong>fferenziale lineare ω = Xdx + Y dy <strong>di</strong> classe C 1 in A, insieme<br />
aperto <strong>di</strong> R 2 , si <strong>di</strong>ce chiusa se per ogni punto P <strong>di</strong> A risulta<br />
∂X<br />
∂y = ∂Y<br />
∂x<br />
Teorema 9.6.1 Data ω = Xdx+Y dy una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in un insieme<br />
aperto A ⊂ R 2 , ω esatta =⇒ ω chiusa.<br />
Dimostrazione. Se ω è esatta, vuol <strong>di</strong>re che esiste una primitiva, F , tale che F x = X<br />
e F y = Y . Per ipotesi ω è <strong>di</strong> classe C 1 , cioè le derivate parziali <strong>di</strong> X e Y sono continue. Di<br />
conseguenza F è <strong>di</strong> classe C 2 (poichè le sue derivate parziali del secondo or<strong>di</strong>ne coincidono<br />
con le derivate parziali prime <strong>di</strong> X e Y ). Inoltre si ha<br />
∂F 2<br />
∂x∂y = ∂X<br />
∂y<br />
e<br />
∂F 2<br />
∂y∂x = ∂Y<br />
∂x<br />
Per il teorema <strong>di</strong> Schwartz, le derivate parziali miste <strong>di</strong> F coincidono,<br />
risulta<br />
∂X<br />
∂y = ∂Y<br />
∂x<br />
∂F 2<br />
∂x∂y = ∂F 2<br />
∂y∂x , quin<strong>di</strong><br />
L’asserto è provato. ✔<br />
Osserviamo che il viceversa non vale sempre. Si possono avere forme <strong>di</strong>fferenziali chiuse che<br />
non sono esatte.<br />
Per poter avere l’implicazione ω chiusa ⇒ ω esatta, la forma <strong>di</strong>fferenziale lineare deve<br />
essere definita in un insieme particolare. Introduciamo, perciò, la definizione <strong>di</strong> insieme<br />
semplicemente connesso.<br />
Definizione 9.6.2 Un sottoinsieme <strong>di</strong> R 2 , A aperto, si <strong>di</strong>ce semplicemente connesso se<br />
G è connesso<br />
G ogni curva generalmente regolare, chiusa e semplice contenuta in A è la frontiera <strong>di</strong> un<br />
insieme limitato contenuto in A.<br />
Dire che A è un insieme semplicemente connesso vuol <strong>di</strong>re che l’insieme è ”senza buchi“,<br />
in quanto ogni curva chiusa e semplice, generalmente regolare, può essere deformata con<br />
continuità fino a ridursi ad un singolo punto. Una corona circolare ha ”buchi“ e, infatti,<br />
non è semplicemente connesso. Il piano privato <strong>di</strong> un punto non è semplicemente connesso.<br />
L’interno <strong>di</strong> un cerchio è semplicemente connesso. La circonferenza non è semplicemente<br />
connesso.<br />
Teorema 9.6.2 Sia ω una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in A aperto e semplicemente<br />
connesso. Allora se ω è chiusa, ω è esatta.<br />
149
Bibliografia<br />
[1] DAWKINS, P. (2007), Calculus I, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />
terms.aspx.<br />
[2] DAWKINS, P. (2007), Calculus II, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />
terms.aspx.<br />
[3] DAWKINS, P. (2007), Calculus III, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />
terms.aspx.<br />
[4] GUICHARD, D. (2012), Calculus, Late Trascendentals, Creative Commons Attribution<br />
Non-Commercial-ShareAlike License, https://www.whitman.edu/mathematics/<br />
multivariable_late/.<br />
[5] KEISLER, H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Commons<br />
Attribution Non-Commercial-ShareAlike License, http://www.math.wisc.edu/<br />
~Keisler/calc.html.<br />
[6] STEWAR T, J. (2003), Calculus, Thomson-Brooks/Cole.<br />
[7] STEWAR T, J. (2007), Calculus, Early Transcendentals, Thomson,Brooks/Cole.<br />
[8] STRANG, G. (1991), Calculus, Wellesley-Cambridge Press.<br />
[9] TRENCH, W. F. (2012), Introduction to Real Analysis, Free Hyperlinked E<strong>di</strong>tion 2.00,<br />
February 2012.<br />
151