Calcolo Numerico

UNIVERSITÀ DEGLI STUDI DI FIRENZE 

FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI 

Corso di Laurea in Informatica 

Calcolo 

Numerico 

Roberto Balducci 

Professore Luigi Brugnano 

ANNO ACCADEMICO 2006-2007

Indice 

1 Introduzione 3 

2 Errori ed aritmetica finita 4 

2.1 Errori di discretizzazione . . . . . . . . . . . . . . . . . . . . . . 5 

2.2 Errori di convergenza . . . . . . . . . . . . . . . . . . . . . . . . 6 

2.3 Errori di round-off . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2.3.1 Numeri interi . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2.3.2 Numeri reali . . . . . . . . . . . . . . . . . . . . . . . . . 9 

2.3.3 Overflow e underflow . . . . . . . . . . . . . . . . . . . . 11 

2.3.4 Lo standard IEEE 754 . . . . . . . . . . . . . . . . . . . . 11 

2.3.5 Aritmetica finita . . . . . . . . . . . . . . . . . . . . . . . 13 

2.3.6 Condizionamento del problema . . . . . . . . . . . . . . . 15 

3 Radici di un equazione 19 

3.1 Il metodo di bisezione . . . . . . . . . . . . . . . . . . . . . . . . 19 

3.1.1 Criterio d’arresto . . . . . . . . . . . . . . . . . . . . . . . 20 

3.2 Metodo di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

3.2.1 Convergenza locale . . . . . . . . . . . . . . . . . . . . . . 28 

3.2.2 Criterio d’arresto . . . . . . . . . . . . . . . . . . . . . . . 30 

3.2.3 Ancora sul criterio d’arresto . . . . . . . . . . . . . . . . . 35 

3.2.4 Radici multiple . . . . . . . . . . . . . . . . . . . . . . . . 36 

3.3 Metodi quasi-Newton . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4 Sistemi lineari 46 

4.1 Casi elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 

4.1.1 Matrici diagonali . . . . . . . . . . . . . . . . . . . . . . . 46 

4.1.2 Matrici triangolari . . . . . . . . . . . . . . . . . . . . . . 48 

4.1.3 Matrici ortogonali . . . . . . . . . . . . . . . . . . . . . . 51 

4.2 Metodi di fattorizzazione . . . . . . . . . . . . . . . . . . . . . . . 52 

4.3 Fattorizzazione LU di una matrice . . . . . . . . . . . . . . . . . 52 

4.3.1 Costo computazionale . . . . . . . . . . . . . . . . . . . . 60 

4.4 Matrici a diagonale dominante . . . . . . . . . . . . . . . . . . . 60 

4.5 Matrici sdp: fattorizzazione LDL T . . . . . . . . . . . . . . . . . 61 

4.6 Fattorizzazione LU con pivoting . . . . . . . . . . . . . . . . . . 64 

4.7 Condizionamento del problema . . . . . . . . . . . . . . . . . . . 69 

4.8 Sistemi lineari sovradimensionati . . . . . . . . . . . . . . . . . . 72 

4.9 Esistenza della fattorizzazione QR . . . . . . . . . . . . . . . . . 73 

1

5 Approssimazione di funzioni 79 

5.1 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . . . 79 

5.2 Forma di Lagrange e forma di Newton . . . . . . . . . . . . . . . 80 

5.3 Interpolazione di Hermite . . . . . . . . . . . . . . . . . . . . . . 90 

5.4 Errore nell’interpolazione . . . . . . . . . . . . . . . . . . . . . . 91 

5.5 Condizionamento del problema . . . . . . . . . . . . . . . . . . . 93 

5.6 Ascisse di Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . 95 

5.7 Interpolazione mediante funzioni spline . . . . . . . . . . . . . . . 96 

5.8 Spline cubiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 

5.9 Calcolo spline cubica . . . . . . . . . . . . . . . . . . . . . . . . . 98 

5.10 Approssimazione polinomiale ai minimi quadrati . . . . . . . . . 102 

6 Formule di quadratura 104 

6.1 Metodo di Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . 104 

6.2 Errore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

6.3 Formule composite . . . . . . . . . . . . . . . . . . . . . . . . . . 107 

6.4 Formule adattive . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 

2

Capitolo 1 

Introduzione 

Il calcolo numerico è una disciplina che rientra nel campo della matematica 

applicata.L’obiettivo di questa scienza è dare una soluzione, il più possibile accurata 

ed efficiente, a tutti quei problemi di natura matematica. Nel calcolo 

numerico, a differenza del calcolo simbolico, importa andare a calcolare la soluzione 

con dei vincoli di tempo e precisione. Facciamo l’esempio della centralina 

dell’ABS che comanda il servofreno di un automobile. Quando la leva del freno 

viene premuta, la centralina deve elaborare i dati in ingresso in tempo e con 

una precisione appropriata, altrimenti rischieremmo il bloccaggio delle ruote 

con il rischio di provocare un incidente. Come si può facilmente intuire, sono 

innumerevoli gli esempi nei quali il calcolo numerico ricopre una fondamentale 

importanza. Questa scienza quindi presterà particolare attenzione agli errori che 

vengono commessi nelle varie fasi dello sviluppo degli algoritmi atti a ottenere 

la soluzione numerica del problema. 

3

Capitolo 2 

Errori ed aritmetica finita 

L’utilizzo di tecnologie digitali, indispensabili nell’analisi numerica, porta inevitabilmente 

a rappresentare un valore, sia esso x ∈ R, nell’ambito dell’aritmetica 

finita. Con questi valori digitalizzati, poi si svolgono operazioni che potrebero 

portare ad un valore nel campo dei reali. Ancora una volta dobbiamo rappresentare 

questo risultato con un’aritmetica finita. Vediamo allora come si può 

misurare l’errore. 

Chiamiamo errore assoluto, e la indichiamo con ∆x, la differenza tra ˜x, il dato 

approssimato, e x, il dato esatto. 

∆x ≡ ˜x − x (2.1) 

Esempio 1. Se x = Π e ˜x = 3.14 l’errore assoluto che commettiamo è pari a 

∆x ≈ −1.6 · 10 −3 . 

Notiamo subito che l’errore assoluto non fornisce un informazione di per sè 

attendibile. Infatti un errore di −1.6 · 10 −3 , risulterebbe essere macroscopico 

nel campo delle nanotecnologie, oppure assolutamente trascurabile se parliamo 

di distanze intergalattiche. Si ha la necessità quindi di definire l’errore relativo: 

ǫx ≡ ∆x 

x 

= ˜x − x 

x 

Dalla 2.2 con qualche passaggio algebrico arriviamo alla forma 

(2.2) 

˜x = x(1 + ǫx) ⇒ ˜x 

= 1 + ǫx 

x 

Pertanto l’errore relativo dobbiamo confrontarlo con l’unità.Un errore relativo ≈ 

1, ci dice che l’errore commesso è troppo grande. Mentre un errore relativo 

dell’ordine di 10−6 , ci dice che abbiamo sbagliato di una parte su un milione, 

il che è trascurabile. 

Esempio 2. Consideriamo ˜π = 3.14 e π ≈ 3.1415926535. 

∆x = ˜π − π ≈ 1.5926535 · 10 −3 ǫx = ∆x 

π 

≈ 0, 506957354 · 10−3 

La cosa si fa interessante se consideriamo l’intero più piccolo del logaritmo in 

base 10 dell’errore relativo. Infatti − log 10 |ǫx| ≈ 3, 295028 ⇒ ⌊− log 10 |ǫx|⌋ = 3, 

che guarda caso sono il numero di cifre decimali uguali tra il valore approssimato 

e quello esatto. 

4

2.1 Errori di discretizzazione 

Nei problemi matematici molto spesso abbiamo a che fare con funzioni che 

operano nel continuo, e che devono essere discretizzate. Facciamo un esempio: 

data la funzione f(x) e ¯x ∈ R si chiede di calcolare f ′ (¯x), ma invece di calcolare 

la derivata, non sempre evidente, si cercano sue approssimazioni. 

Per il nostro scopo usiamo la definizione di rapporto incrementale: 

f ′ f(¯x + h) − f(¯x) 

(¯x) = limh→0 

h 

≈ f(¯x + ¯ h) − f(¯x) 

¯h 

¯h è piccolo e opportunamente scelto, percui l’approssimazione è una quantità 

discreta visto che ¯ h non può tendere a 0. 

Deduciamo dunque che l’errore corrispondente è appunto l’errore di discretizzazione, 

ma vediamo a quanto ammonta: Sviluppiamo quindi con taylor la 

funzione f(x)con punto iniziale ¯x con resto al secondo ordine 

f(¯x + h) = f(¯x) + h · f ′ (¯x) + h2 

2 · f ′′ (ξ) ξ ∈ (¯x, ¯x + h) 

f(¯x + h) − f(¯x) 

h 

h 

Possiamo scrivere in modo del tutto equivalente 

= f(¯x) + h · f ′ (¯x) + h2 

2 · f(2) (ξ) − f(¯x) 

= f ′ (¯x)+ h 

2 f(2) (ξ) 

f ′ f(¯x + h) − f(¯x) 

(¯x) = − 

h 

h 

2 f(2) (ξ) 

Questo significa che usando il rapporto incrementale per calcolare la derivata 

della funzione f(x) nel punto ¯x, si commette un errore pari a h 

2f(2) (ξ), che per 

h → 0 è un o(h) 

Per calcolare la derivata di una funzione, possiamo usare un altro metodo che 

risulta più accurato. Consideriamo ad esempio la seguente espressione 

f(¯x + h) − f(¯x − h) 

2h 

Sviluppiamo ancora i due addendi del numeratore 

f(¯x + h) = f(¯x) + h · f ′ (¯x) + h2 

2 · f(2) (¯x) + h(3) 

· f 

3! 

(3) (ψ) 

Dove ψ, ζ ∈ (¯x, ¯x + h) 

f(¯x − h) = f(¯x) − h · f ′ (¯x) + h2 

2 · f(2) (¯x) − h(3) 

· f 

3! 

(3) (ζ) 

f(¯x + h) − f(¯x − h) 

2h 

= f ′ (¯x) + h2 

3! · (f(3) (ψ) + f (3) (ζ)) 

Con qualche semplificazione arriviamo al seguente risultato: 

f ′ (¯x) = 

f(¯x + h) − f(¯x − h) 

2h 

− h2 

3! · (f(3) (ψ) + f (3) (ζ)) 

(2.3) 

Per h → 0 l’addendo h2 

3! ·(f(3) (ψ)+f (3) (ζ)) si comporta come un o(h 2 ). Questo 

sta a significare che approssimando la derivata f ′ (¯x) con la 2.3 si ha un errore 

che si comporta come h 2 . In questo modo trasformiamo dunque un problema 

continuo in uno discreto, introducendo un errore. 

5

2.2 Errori di convergenza 

Nell’universo dei metodi matematici, esistono degli algoritmi che forniscono un 

risultato tanto più approssimato quante più volte si reitera l’algoritmo stesso. 

Sia x ∗ il risultato esatto del problema. Definiamo quindi la funzione di iterazione 

come segue: 

xn+1 = Φ(xn), n = 0, 1, 2, · · · (2.4) 

Cerchiamo di capire come funziona generalmente una funzione di iterazione, 

e quali sono le condizioni per le quali questa funzione è consistente. 

Il valore iniziale di ingresso della funzione è x0, un approssimazione (a volte 

anche molto lasca) di x ∗ . Il metodo si dice convergente se: 

lim 

n→∞ xn = x ∗ 

(2.5) 

La funzione 2.4 rispetta il teorema del punto fisso; sostanzialmente Φ(x ∗ ) = x ∗ . 

La soluzione del problema si ricava solamente iterando infinite volte la funzione 

2.4. Quindi affinchè si possa utilizzare la soluzione fornita da un metodo siffatto, 

dovremmo definire un opportuno criterio d’arresto. Se arrestiamo l’esecuzione 

a n = N − 1, calcoleremo xN. Definiamo quindi l’errore di convergenza come: 

xN − x ∗ 

(2.6) 

Vediamo due metodi per calcolare √ 2 = 1, 4142135623730950488016887242097 

Esempio 3 (Calcolo di √ 2-prima versione). 

Consideriamo la funzione di iterazione seguente 

xn+1 = 1 

2 (xn + 2 

xn 

), n = 0, 1, 2, · · · x0 = 2 

È interessante notare come l’algoritmo sopra descritto rispetti il teorema del 

punto fisso. Infatti 

1 

2 · 

√ 

√2 2 2 1 

+ √2 = + √ = 

2 2 2 

√ = 

2 √ 2 

Vediamo come in Matlab può essere implementata e quali risultati possiamo 

ottenere. 

risultato=[]; 

x=2; 

y=0; 

for i=1:10 

y=1/2*(x+2/x); 

risultato(i,:)=[i,y]; 

x=y; 

end 

Il risultato dell’esecuzione di questo listato è di seguito, mostra sulla colonna 

di sinistra l’iterazione i-esima e sulla colonna di destra il valore di xi.Come si 

può vedere il metodo converge molto velocemente al valore √ 2 

6

1.00000000000000 1.50000000000000 

2.00000000000000 1.41666666666667 

3.00000000000000 1.41421568627451 

4.00000000000000 1.41421356237469 

5.00000000000000 1.41421356237309 

6.00000000000000 1.41421356237309 

7.00000000000000 1.41421356237309 

8.00000000000000 1.41421356237309 

9.00000000000000 1.41421356237309 

10.00000000000000 1.41421356237309 

Esempio 4 (Calcolo di √ 2-seconda versione). 

Questa è la seconda funzione per il calcolo di √ 2 

xn+1 = xn · xn−1 + 2 

xn + xn+1 

x0 = 2 , x1 = 1.5 

Anche questo algoritmo rispetta il teorema del punto fisso. Infatti ipotizzando 

che alla n + 1-esima iterazione siamo arrivati a calcolare √ 2 abbiamo che: 

√ 2 √ 2 + 2 

√ 2 + √ 2 = 

2 + 2 

2 · √ 2 

= 2 

√ 2 = √ 2 

risultato (1,:)=[0,2]; 

risultato (2,:)=[1,1.5]; 

y=0; 

for i=3:10 

y=(risultato(i-1,2)*risultato(i-2,2)+2)/(risultato(i-1,2)+risultato(i-2,2)); 

risultato(i,:)=[i-1,y]; 

end 

Come si può notare, a parità di iterazione, la prima verione dell’algoritmo è 

molto più efficiente della seconda. 

0 2.00000000000000 

1.00000000000000 1.50000000000000 

2.00000000000000 1.42857142857143 

3.00000000000000 1.41463414634146 

4.00000000000000 1.41421568627451 

5.00000000000000 1.41421356268887 

6.00000000000000 1.41421356237310 

7.00000000000000 1.41421356237310 

8.00000000000000 1.41421356237309 

9.00000000000000 1.41421356237310 

10.00000000000000 1.41421356237310 

11.00000000000000 1.41421356237309 

7

2.3 Errori di round-off 

Nell’ambito dell’analisi numerica una delle problematiche maggiori è l’analisi 

degli errori. In ogni fase di risoluzione di un problema reale si commettono 

degli errori. Nella scelta del modello matematico s’introducono gli errori dovuti 

all’aggiunta di ipotesi semplificative, ad una incompleta o inesatta deduzione 

del modello stesso; tali errori saranno tanto più piccoli quanto più le ipotesi saranno 

soddisfatte. Nella fase di discretizzazione del modello s’introduce l’errore 

di troncamento analitico, dovuto, ad esempio, alla sostituzione di insiemi continui 

con insiemi discreti o all’approssimazione di operazioni basate sul concetto 

di infinito con operazioni razionali in numero finito. Nell’ultima fase, infine, 

intervengono gli errori di round-off dovuti all’approssimazione di numeri reali 

con numeri macchina. 

Un calcolatore numerico, infatti, è in grado di rappresentare soltanto un 

numero finito di cifre; ne consegue la possibilità che un numero reale introdotto 

nel calcolatore sia approssimato. Inoltre le operazioni elementari eseguite su tali 

numeri possono e loro volta, produrre risultati non rappresentabili esattamente 

nel calcolatore. Pertanto, quando un algoritmo, costituito da una successione 

di operazioni elementari, è eseguito su un calcolatore, si ha in generale una 

creazione e successiva propagazione di errori. Tali errori sono appunto gli errori 

di arrotondamento o round-off. 

L’errore di troncamento è una discrepanza introdotta dal fatto che i metodi 

numerici utilizzano delle approssimazioni per eseguire calcoli matematici e 

rappresentare quantità esatte. 

Il risultato prodotto dall’algoritmo differisce, quindi in generale dal risultato 

esatto, cioè da quel risultato ideale che si otterrebbe operando con tutte le cifre 

richieste. Il risultato dipenderà da come le perturbazioni, cioè la successione 

di errori, si amplificheranno. Lo studio del comportamento degli errori nonché 

la progettazione di tecniche per contenerne la propagazione, stanno alla base 

di qualsiasi algoritmo per il calcolo numerico, in quanto, l’amplificazione di un 

errore anche piccolo può addirittura invalidare il risultato dell’algoritmo. In 

questo capitolo ci occuperemo di studiare come vengono rappresentati i numeri 

nel calcolatore; vedremo anche gli errori che vengono introdotti da questa 

operazione. Non andremo a considerare gli errori di propagazione, in quanto 

richiederebbe un analisi molto più approfondita. 

2.3.1 Numeri interi 

Un numero intero viene memorizzato, nel calcolatore, come una stringa di N +1 

cifre nel seguente modo: 

α0α1 · · · αN 

(2.7) 

dove b ∈ N è la base del numero e 

α0 ∈ {+, −}, αi ∈ {0, 1, · · · , b − 1} i = 1, · · · , N 

Con la stringa 2.7 si può rappresentare il numero 

N 

n = i=1 αibN−i , se α0 = + 

N i=1 αibN−i − bN , se α0 = − 

8 

(2.8)

Esempio 5. Consideriamo il caso di una variabile di tipo int.Nel linguaggio 

java questa variabile occupa 16 bit. Il suo intervallo di rappresentazione è 

[−32768, 32767]. È interessante notare che i numeri positivi hanno il bit α0 = 0; 

di contro i numeri negativi hanno il bit α0 = 1. 

2.3.2 Numeri reali 

Un numero reale viene memorizzato, nel calcolatore, mediante una stringa di 

m + 1 + s cifre nel seguente modo: 

dove b ∈ N è la base del numero e 

α0α1 · · · αmβ1 · · · βs 

(2.9) 

α0 ∈ {+, −}, αi, βj ∈ {0, 1, · · · , b − 1} i = 1, · · · , m, j = 1, · · · , s e α1 = 0 

Definiamo rispettivamente la mantissa e l’esponente 

ρ = 

m 

i=1 

αib 1−i = α1b 0 + α2b −1 + · · · + αnb 1−m 

 

α1,α2,··· ,αm 

(2.10) 

η = e − ν (2.11) 

La stringa 2.9 andrà a denotare il numero reale r definito di seguito: 

r = ± m 

i=1 

αib 1−i b e−ν , dove e = 

s 

βjb s−j 

j=1 

(2.12) 

Il numero ν ∈ N è fissato a priori, in modo tale da dividere circa a metà l’intervallo 

dei numeri che si possono formare con e bit. Questo viene fatto per evitare 

di sprecare un bit per il segno. Infatti il numero ν rappresenta uno shift. Allora 

il numero 2.11 risulterà sempre positivo. 

Teorema 1. ρ un numero tale che 1 ≤ ρ < b 

Vediamo che ρmin ≥ 1; Il minimo valore che può assumere ρ, sia esso ρmin, si 

ha quando αi = 0, i = 2, · · · , m e α1 = 1. Quindi 

ρmin = α1b 0 + α2b −1 + · · · + αmb 1−m 

= α1b 

 

0 

0 ≥ 1. 

Invece il massimo valore che può assumere ρ, sia esso ρmax, si ha quando αi = 

b − 1, i = 1, · · · , m. Quindi 

m 

ρmax = (b−1)·b 1−i m 

= (b−1)·b b −i 1 − b−m 

= (b−1)·b· 

b − 1 = b·(1−b−m ) ≤ b 

i=1 

i=1 

Teorema 2. e è un numero tale che −ν ≤ e ≤ b s − 1 − ν. 

La dimostrazione di questo teorema è del tutto analoga a quella del teorema 1. 

9

Teorema 3. Il più piccolo ed il più grande, in valore assoluto, tra i numeri di 

macchina diversi da zero, sono rispettivamente: 

r1 = ρmin · b −ν 

(2.13) 

r2 = ρmax · b emax (2.14) 

Definizione 1. Si definisce l’insieme dei numeri di macchina come: 

⎧ 

⎨ 

M = 

⎩ x ∈ R : x = ±ρbe m 

, ρ = αib 1−i s 

, e = βjb s−j 

⎫ 

⎬ 

∪ {∅} (2.15) 

⎭ 

i=1 

Definizione 2. Definiamo allora l’insieme 

j=1 

I = [−r2, −r1] ∪ {0} ∪ [r1, r2] (2.16) 

Dobbiamo sottolineare che M ⊆ I, in quanto I un insieme definito nel 

continuo, mentre M è definito nel discreto. 

Si rende necessario quindi definire una funzione: 

fl : I → M (2.17) 

che prende in input un numero reale x ∈ R e restituisce in output fl(x) ∈ M. 

In generale nell’applicazione della funzione fl si genera un errore di rappresentazione 

dovuto al fatto che quasi sempre fl(x) = x. Dato un generico elemento 

positivo di I 

x = (α1α2 · · ·αmαm+1 · · · )b e−ν 

Elenchiamo di seguito le due possibili rappresentazioni: 

• Rappresentazione per troncamento 

fl(x) = (α1α2 · · · αm)b e−ν 

(2.18) 

Questo vuol dire che abbiamo troncato la mantissa di x alla sua m-esima 

cifa significativa. 

• Rappresentazione per arrotondamento 

con 

fl(x) = (α1α2 · · · αm−1˜αm)b e−ν 

˜αm = 

αm, se αm+1 < b/2 

αm + 1, se αm+1 ≥ b/2 

(2.19) 

(2.20) 

Nel caso in cui ˜αm ≥ b ci sarà evidentemente un riporto sulle cifre precedenti 

la m-esima. 

Definiamo quindi due casi particolari per la funzione fl(x): 

• fl(0) = 0 

• fl(x) = −fl(−x), se x ∈ I, x < 0 

Definizione 3. Il numero u viene definito precisione di macchina 

 

1−m b , in caso di troncamento 

u = 

1/2 · b1−m , in caso di arrotondamento 

Teorema 4. Se x ∈ I e x = 0 allora: 

fl(x) = x · (1 + ǫx) 

10

2.3.3 Overflow e underflow 

Quando si vuole rappresentare numeri non contenuti in I (vedi 2.16), si può 

incorrere in condizioni d’errore. Due casi particolari si hanno quando: 

• |x| > r2. In questo caso si verifica una condizione di overflow. 

• 0 < |x| < r1. In questo caso invece si verifica una condizione di underflow. 

Nella prossima sezione verranno illustrati i metodi di recovery secondo lo standard 

IEEE 754 delle situazioni sopracitate. 

2.3.4 Lo standard IEEE 754 

Circa 40 anni fa l’anarchia minacciava l’aritmetica in virgola mobile.Oltre una 

dozzina di aritmetiche proprietarie, vantavano diverse wordsize 1 , precisioni, 

procedure di arrotondamento, e diversi comportamenti in caso di owerflow e 

underflow. Sviluppare codice portabile divenne molto presto economicamente 

costoso, visto la diversità di aritmetica mobile nelle svariate architetture. Circa 

30 anni fa, quando lo standard divenne ufficiale, la maggior parte dei produttori 

di microprocessori adottò questa architettura, malgrado la sfida lanciata dagli 

implementatori.Con un altruismo inaspettato, gli hardware designers uscirono 

dalla competizione per la progettazione della miglior aritmetica, con la speranza 

di incoraggiare e facilitare un più massiccio sviluppo di software numerico. 

Appunto fu creato lo standard ANSI/IEEE Std 754-1985. Questo standard 

fu definito per fare in modo che lo stesso software, potesse essere eseguito su 

più piattaforme, solamente ricompilando il codice sorgente, e con il requisito 

di dare lo stesso risultato se eseguito su piattaforme differenti. Lo standard in 

questione definisce tre tipi di formati per i numeri in virgola mobile: single, 

double, double extended. Affinché una macchina possa vantare di rispettare lo 

standard, deve implementare correttamente i numeri in virgola mobile in singola 

e doppia precisione. La doppia precisione estesa, infatti, opzionale, e non tutte 

le piattaforme e linguaggi la implementano. La mantissa memorizzata in forma 

binaira (base 2): 

. 1.f se il numero normalizzato ovvero se la prima cifra 1. 

. 0.f se il numero denormalizzato. 

Siccome la cifra della parte intera è sempre nota a priori, è possibile ometterla, 

risparmiando così 1 bit per la sua memorizzazione esplicita. 

Di seguito vengono mostrate più in dettaglio le due forme per i numeri in 

virgola mobile. 

• Singola precisione 

1 8 23 lunghezza in bit 

+-+--------+-----------------------+ 

|s| e | f | 

+-+--------+-----------------------+ 

32 31 23 0 indice dei bit 

1 lunghezza di un istruzione 

11

Come si può vedere dalla rappresentazione ascii, la singola precisione memorizza 

un numero in virgola mobile usando 32 bit, dei quali uno usato 

per il segno (e), otto per l’esponente (s) e i restanti ventitre per la mantissa 

(f ). Con riferimento alla notazione usata in (2.9)-(2.12) sono da 

considerare i seguenti casi: 

. se 0 < e < 255, la mantissa è normalizzata e ν = 127; 

. se e = 0 e f = 0, la mantissa è denormalizzata e ν = 126; 

. se e = f = 0, si ha zero (negativo o positivo); 

. se e = 255, α0 = 0, f = 0, si ha +inf; 

. se e = 255, α0 = 1, f = 0, si ha -inf; 

. se e = 255, f = 0, si ha un Nan (Not a Number); 

IEEE 754 definisce che le seguenti operazioni diano come risultato Nan: 

– √ numero negativo, radice di un numero negativo; 

– 0 ∗ ∞ zero moltiplicato infinito; 

– 0.0/0.0 zero diviso zero; 

– ∞/∞ infinito diviso infinito; 

– numero%0.0 resto della divisione di un numero per zero (operazione 

modulo); 

– ∞%numero resto della divisione di infinito per un numero; 

– ∞ − ∞ infinito meno infinito (n.b. ∞ + ∞ = ∞); 

• Doppia precisione 

1 11 52 lunghezza in bit 

+-+-----------+----------------------------------------------------+ 

|s| e | f | 

+-+-----------+----------------------------------------------------+ 

64 63 52 0 indice dei bit 

. se 0 < e < 2047, la mantissa normalizzata e ν = 1023; 

. se e = 0 e f = 0, la mantissa denormalizzata e ν = 1022; 

. se e = f = 0, si ha zero (negativo o positivo); 

. se e = 2047, α0 = 0, f = 0, si ha +inf; 

. se e = 2047, α0 = 1, f = 0, si ha -inf; 

. se e = 2047, f = 0, si ha un Nan (Not a Number); 

Esempio 6. Calcoliamo con l’aiuto di matlab i seguenti numeri in doppia 

precisione: 

. il più grande numero di macchina 

12

help realmax 

REALMAX Largest positive floating point number. 

x = realmax is the largest double precision floating point number 

representable on this computer. Anything larger overflows. 

>> REALMAX(’double’) 

ans = 1.797693134862316e+308 

. il più piccolo numero di macchina normalizzato positivo 

>> help realmin 

REALMIN Smallest positive floating point number. 

x = realmin is the smallest positive normalized double precision floating 

point number on this computer. Anything smaller underflows or is an IEEE 

"denormal". 

>> REALMIN(’double’) 

ans = 2.225073858507201e-308 

. il più piccolo numero di macchina denormalizzato positivo. 

Per calcolare questo numero non vi è una funzione precisa. Però dalla definizione 

di numero denormalizzato (2.12), possiamo ricavarlo facilemte. 

Infatti il più piccolo numero denormalizzato è quello con mantissa composta 

da tutti zeri tranne il primo bit settato a 1, esponente settato a zero, e 

ν settato a 1022. Quindi basta calcolare la formula 2 1−53 2 − 1022, ottenuta 

dalla 2.12 sostituendo i valori di m, i, e ν. Ecco il risultato ottenuto: 

>> (2^-52)*(2^-1022) 

ans = 4.9407e-324 

. la precisione di macchina 

>> help eps 

eps returns the distance from 1.0 to the next largest double-precision number, 

that is eps = 2^(-52). 

>> eps 

ans = 2.220446049250313e-016 

2.3.5 Aritmetica finita 

Quando effettuiamo delle operazioni matematiche, sappiamo che valgono determinate 

proprietà. In particolare se condideriamo la somma, sappiamo che gode 

delle proprietà commutativa e associativa. Essa viene preservata nel caso di 

numeri interi. Ciò non accade con i numeri in virgola mobile. Infatti quando 

13

sommiamo due nuemri, x e y, in aritmetica finita, x ⊕ y, devono prima essere 

convertiti in numeri di macchina, dopodiché si esegue la somma e si rappresenta 

il risultato come numero di macchina; Con riferimento alla funzione 2.17, 

possiamo scrivere: 

x ⊕ y = fl(fl(x) + fl(y)), x, y ∈ R 

Mostriamo un semplice esempio tratto da [4]: 

Esempio 7. In aritmetica esatta, il valore di e è banale: 

a = 4/3 

b = a − 1 

c = b + b + b 

e = 1 − c 

Infatti esso è zero. Se in matlab eseguiamo queste righe di codice, 

a=4/3; 

b=a-1; 

c=b+b+b; 

e=1-c 

il risultato sarà: 

e =2.220446049250313e-016 

Ancora un altro esercizio sulla rappresentazione dei numeri in virgola mobile 

in aritmetica finita: 

Esempio 8. x=0; 

delta=0.1; 

while x ~= 1 

x = x+delta; 

end 

Il risultato è che il ciclo è infinito, perché la condizione non è mai vera. 

Cosideriamo questa istruzione t = 0.1. Il valore di t non è esattamente 0.1, 

perché la frazione 1 

10 ,per essere espressa in aritmetica finita , richiede una serie 

infinita. Infatti: 

1 1 1 0 0 1 1 0 0 1 

= + + + + + + + + + · · · 

10 24 25 26 27 28 29 210 211 212 Dopo il primo termine, la sequenza di coefficienti 1,0,0,1, si ripete all’infinito. 

Il numero reale 0.1, ottenuto dal’arrotondamento della suddetta serie al 53◦ termine, incluso l’arrotondamento degli ultimi quattro coefficienti, in binario 

1010. Se raggruppiamo i termini della serie descritta a gruppi di 4, possiamo 

riscriverla in base 16, ovvero esadecimale, ne seguente modo: 

t = (1 + 9 9 9 9 9 

+ + + · · · + + ) ∗ 2−4 

16 162 163 1612 1613 Il comando Matlab, format hex, ci può far vedere il contenuto di t in fomra 

esadecimale che è 3fb999999999999a. I primi tre caratteri 3fb si riferiscono 

all’esponente polarizzato e + 1023, dove e = −4. Gli altri tredici caratteri sono 

la rappresentazione della frazione f. Concludendo, il valore memorizzato in t, 

si avvicina molto a 0.1, ma non è esattamente 0.1. 

14

2.3.6 Condizionamento del problema 

Dato un problema espresso tramite relazioni tra valori numerici, il condizionamento 

è un valore che quantifica di quanto viene amplificato l’errore in ogni computazione 

tra gli errori sui dati in ingresso e quelli sui dati in uscita. Possiamo 

formalizzare il problema come una funzione: 

dove 

x rappresenta i parametri di input 

f rappresenta la descrizione del problema 

y rappresenta i dati di output 

y = f(x) (2.21) 

Senza perdita di generalità possiamo assumere che x, y ∈ R e f : R → R con 

f ∈ C 2 Quindi possiamo formalizzare il problema matematico come 

dove 

˜x = ˜ f(˜x) (2.22) 

˜x rappresenta i dati di input perturbati, sia da errori di rappresentazione 

che da errori di misurazioni. 

˜f rappresenta il metodo numerico utilizzato per risolvere il problema, che 

può presentare errori di discretizzazione o convergenza oppure entrambi. 

˜y rappresenta i dati di output perturbati in quanto sia i dati di input che 

la funzione risultano perturbati. 

Risulta interessante quindi studiare come le perturbazioni sui dati in input 

affliggono i risultati, supponendo di usare un metodo numerico esatto. 

˜y = f(˜x) (2.23) 

Ovvero vogliamo valutare la differenza ˜y − y in funzione della differenza ˜x − x. 

Se consideriamo gli errori relativi possiamo riscrivere le due differenze in questo 

modo: 

˜x = x(1 + ǫx), ˜y = y(1 + ǫy) (2.24) 

Sviluppando il secondo membro in x delle 2.24, otteniamo 

y + yǫy = f(x) + f ′ (x)xǫx + O(ǫ 2 x ) (2.25) 

Tenendo conto della 2.21 possiamo sostituire ottenendo 

yǫy = f ′ (x)xǫx + O(ǫ 2 x ) 

Se poi consideriamo uno studio al primo ordine si ottiene che: 

 

 

|ǫy| ≈ 

f ′ (x) x 

 

 

 

y ∗ |ǫx| ≡ k |ǫx| (2.26) 

K il fattore di amplificazione, che misura quanto gli errori sui dati in ingresso 

influiscano sui dati in uscita. Ci sono due casi interessanti: 

15

. K ≈ 1 gli errori sui dati in ingresso influiscono pochissimo sui dati in 

uscita. In questo caso il problema è ‘ben condizionato’ 

. K >> 1 gli errori sui dati in uscita sono molto più grandi che sui dati in 

ingresso. Quindi anche un piccolissimo errore sui dati di input, dovuto sia 

all’imprecisione nella misurazione, che nella rappresentazione in aritmetica 

finita, causa un grande errore sui dati di output. In questo caso il problema 

si dice ‘mal condizionato’. 

Osserviamo il condizionamento delle operazioni aritmetiche fondamentali 

Somma 

Studiamo il condizionamento della somma di due variabili x1, x2 ∈ R tali che 

x1 + x2 = 0: 

y = x1 + x2 

(2.27) 

Considerando gli errori relativi per ognuna delle variabili in gioco, otteniamo: 

˜x1 = x1 ∗ (1 + ǫ1) 

˜x2 = x2 ∗ (1 + ǫ2) 

˜y = y ∗ (1 + ǫy) 

Combinando le tre equazioni otteniamo: 

y(1 + ǫy) = x1(1 + ǫ1) + x2(1 + ǫ2) = x1 + x2 + x1ǫ1 + x2ǫ2 

Considerando la 2.27, riusciamo a trovare la stima che stavamo cercando: 

(2.28) 

|ǫy| ≤ |x1| + |x2| 

|x1 + x2| ǫx ≡ kǫx, ǫx = max {|ǫ1| , |ǫ2|} (2.29) 

Ci sono anche in questo caso due casi interessanti: 

• x1x2 > 0:se le due variabili hanno segno concorde la somma è ben condizionata, 

infatti k = 1. 

• x1 ≈ −x2: in questo caso il numero di condizionamento può assumere valori 

arbitrariamente grandi. Infatti nella 2.29 il numeratore diventa ‘grande’, 

mentre il denominatore diventa ‘piccolo’. Questa situazione porta 

fenomeno della cancellazione numerica. 

Esempio 9. Vediamo adesso un esempio di cancellazione numerica, ipotizzando 

di utilizzare una rappresentazione decimale con arrotondamento 

alla quarta cifra significativa. 

y = 

 

0.12345678 

 

− 0.12341234 

 

= 0.00004444 = 4.4 ∗ 10 −5 

x1 

x2 

Calcoliamo adesso la rappresentazione in aritmetica finita con arrotondamento 

alla quarta cifra decimale: 

fl(x1) = 1.235 ∗ 10 −1 

fl(x2) = 1.234 ∗ 10 −1 

16

Vediamo l’errore relativo sui dati in ingresso: 

ǫx1 = fl(x1) − x1 

x1 

ǫx2 = fl(x2) − x2 

x2 

≈ 3.5 ∗ 10 −4 

≈ 1.0 ∗ 10 −4 

Il risultato afflitto da errori di rappresentazione : 

˜y = fl(fl(x1) − fl(x2)) = fl(0.001 ∗ 10 −1 ) = fl(1.0 ∗ 10 −4 ) = 1.000 ∗ 10 −4 

Calcoliamo adesso l’errore relativo sul risultato 

ǫy = 

˜y − y 

y = 1.000 ∗ 10−4 − 4.444 ∗ 10−5 4.444 ∗ 10−5 = 1.25 

Vediamo adesso la costante k del condizionamento del problema, con i 

valori ottenuti 

k = |x1| + |x2| 

|x1 − x2| = 1.2345678 ∗ 10−1 + 1.2341234 ∗ 10−1 4.444 ∗ 10−5 ≈ 5.5 ∗ 10 3 

Abbiamo visto in questo esempio come gli errori relativi sui dati in ingresso 

fossero nella norma, ma l’errore relativo sui dati in uscita era abbastanza 

alto. Tutto questo in accordo con la costante di condizionamento k che 

in questo caso aveva un valore molto elevato 5500. Tenendo conto della 

definizione 2.26 abbiamo che 

k ∗ min {ǫx1, ǫx2} < ǫy < k ∗ max {ǫx1, ǫx2} 

e sostituendo i valori otteniamo 

5.5 ∗ 10 3 ∗ 1.0 ∗ 10 −4 < 1.25 < 5.5 ∗ 10 3 ∗ 3.5 ∗ 10 −4 ⇒ 0.55 < 1.25 < 1.925 

Moltiplicazione 

Studiamo il condizionamento della moltiplicazione di due variabili x1, x2 ∈ R 

tali che x1x2 = 0: 

y = x1 ∗ x2 

(2.30) 

Considerando gli errori relativi, otteniammo la seguente espressione: 

y(1 + ǫy) = x1(1 + ǫ1)x2(1 + ǫ2) = x1x2(1 + ǫ1 + ǫ2 + ǫ1ǫ2) (2.31) 

Trascurando il membro quadratico ǫ1ǫ2, e considerando la 2.30, otteniamo, 

|ǫy| ≈ |ǫ1 + ǫ2| ≤ 2ǫx, doveǫx = max {|ǫ1|,|ǫ2|} (2.32) 

Perciò il numero di condizionamento k = 2. La moltiplicazione in ogni caso 

è un operazione sempre ben condizionata, perché l’errore sui dati in ingresso 

amplifica di un fattore 2 l’errore sui dati in uscita. 

17

Divisione 

Studiamo il condizionamento della divisione di due variabili x1, x2 ∈ R tali che 

x1x2 = 0: 

y = x1 

x2 

(2.33) 

Analogamente a come abbiamo fatto per lo studio del condizionamento della 

moltiplicazione, otteniamo, 

y(1 + ǫy) = x1(1 + ǫ1) 

x2(1 + ǫ2) 

≈ x1 

x2 

(1 + ǫ1)(1 − ǫ2) = x1 

(1 + ǫ1 − ǫ2 − ǫ1ǫ2) (2.34) 

Trascurando quindi il termine quadratico ǫ1ǫ2 e tenendo conto della 2.33, otteniamo, 

|ǫy| ≈ |ǫ1 − ǫ2| ≤ 2ǫx, dove ǫx = max {|ǫ1| , |ǫ2|} (2.35) 

Come per la moltiplicazione, il numero di condizionamento della divisione k = 2. 

Esempio 10. Dimostriamo che il numero di condizionamento del problema del 

calcolo di y = √ x è k = 1/2. 

In questo caso la nostra funzione y = √ x = x 1 

2 = f(x). Applicando la 

definizione del numero di condizionamento 2.26 

 

1 1 

2x− 2x 

 

1 

k = = 

2 

1 

x− 2 

dove la derivata di f(x) è f ′ (x) = 1 1 

2x− 2. Come possiamo vedere l’operazione di 

radice ammette un buon numero di condizionamento. 

18 

x2

Capitolo 3 

Radici di un equazione 

In questo capitolo ci occuperemo di trovare uno zero della funzione f(x). Sia 

data la funzione f(x) : [a, b] ∈ R → R, si cerca di trovare un valore di x ∈ R 

tale che f(x) = 0. Generalmente la funzione può ammettere: 

• un numero finito di soluzioni, per esempio f(x) = (x − 1)(x − 2) 2 ; 

• non ammettere alcuna soluzione, per esempio f(x) = x 2 + 5x + 1; 

• ammettere un numero infinito di soluzioni, per esempio f(x) = cos(x); 

Tuttavia per il nostro problema, prenderemo in considerazione solo il caso 

in cui f(x) ammetta almeno una radice reale. Consideriamo quindi nelle nostre 

ipotesi che f(a) · f(b) < 0. Essendo la funzione continua in tutto l’intervallo 

[a, b], avrà sicuramente uno zero in un punto sia esso x ∗ . Andiamo quindi a 

presentare nelle seguenti sezioni due metodi con diversi criteri di convergenza. 

3.1 Il metodo di bisezione 

Prima di mostrare questo metodo, dobbiamo fare alcune assunzioni sulle funzioni 

che andiamo a considerare per il nostro problema. In particolare la funzione 

f(x) deve soddisfare le seguenti ipotesi. 

• f(x) : [a, b] ∈ R → R 

• f continua ∀x ∈ [a, b] 

• f(a) · f(b) < 0 

Definizione 4. [a, b] si definisce un intervallo di confidenza della funzione f(x) 

per la radice se ∃x ∈ [a, b] tale che f(x) = 0. 

Di seguito descriviamo i passi che devono essere eseguiti per la corretta 

applicazione del metodo di bisezione: 

Calcoliamo una prima approssimazione della radice 

x ∗ ≈ x1 = 

19 

a + b 

2

• se f(x1) = 0 ⇒ x ∗ = x1 

• se f(a) · f(x1) < 0 ⇒ [a, x1] 

• se f(b) · f(x1) < 0 ⇒ [x1, b] 

Questo è il primo passo. Poi si riapplica il procedimento al nuovo intervallo di 

confidenza individuato. Il metodo converge alla soluzione. Si vede chiaramente 

infatti che ad ogni iterazione, l’intervallo di confidenza si dimezza, e che l’n − 

esimo intervallo di confidenza ha dimensione b−a 

2n . Per n → ∞ questo intervallo 

tende ad avere dimensione zero, e siccome è un intervallo di confidenza, esso 

sarà la radice della funzione. Vediamo una prima implementazione in Matlab 

dell’algoritmo di bisezione: 

Algoritmo 3.1 (Metodo di bisezione, implementazione basilare). 

fa=feval(f,a); 

fb=feval(f,b); 

x=(a+b)/2; 

fx=feval(f,x); 

while fx~=0 

if fa*fx

|x ∗ b − a 

− x1| ≤ 

2 

Quindi il nostro errore nell’approssimare x ∗ con x1 è maggiorato da b−a 

2 , 

ovvero la metà dell’intervallo di confidenza iniziale. Sia [ai, bi] l’intervallo di 

confidenza dell’i-esima iterazione dell’algoritmo di bisezione. Abbiamo allora 

che 

|x ∗ − xi| < bi − ai 

2 

= bi−1 − ai−1 

2 2 

Il nostro criterio d’arresto sarà 

= bi−2 − ai−2 

2 3 

= . . . = b1 − a1 

2 i 

b − a 

≤ tolx 

2i dove tolx rappresenta la tolleranza desiderata. Con qualche semplice passaggio 

abbiamo quindi che 

b − a 

≤ 2i 

tolx 

Quindi i sarà il numero massimo di iterazioni, per ottenere la tolleranza 

richiesta 

imax = ⌈log 2(b − a) − log 2(tolx)⌉ 

Una volta introdotto il concetto di tolleranza, possiamo modificare l’algoritmo 

3.5 per ricavarne uno con un criterio d’arresto più efficace. Prima però 

dobbiamo risolvere il problema della condizione f(xi) = 0, che difficilmente si 

verifica in aritmetica finita. Siccome per ipotesi la funzione è continua nell’intervallo 

[a, b], abbiamo che in un intorno di x, sia esso [x − tolx, x + tolx], si 

verifica la condizione che |f(xi) − f(x ∗ )| ≤ tolf. Per definizione f(x ∗ ) = 0, 

quindi il nuovo criterio d’arresto diventa |f(xi)| ≤ tolf , ovvero 

abs(fx)

• f ′ (x ∗ ) ≈ 0 in questo caso, la situazione è favorevole, perché fissato tolf il 

criterio d’arresto sarà molto lasco. 

• |f ′ (x ∗ )| ≫ 1 in quest’altro caso invece fissato tolx, tolf risulterà molto 

più grande. 

Per arrivare all’algoritmo finale del il metodo di bisezione, ci serve uno strumento 

per calcolare la derivata di un punto. Ebbene ci serviamo della seguente 

formula: 

f ′ (x ∗ ) ≈ f(bi) − f(ai) 

bi − ai 

(3.2) 

Questa, evidentemente è solo un approssimazione, ma è molto facile da calcolare, 

ed è tanto più precisa, quanto più la funzione è regolare e l’intervallo di 

confidenza è piccolo. In più, questa formula, ha il vantaggio di costare poco, dal 

punto di vista computazionale, perché f(bi)e f(ai) li abbiamo già calcolati. 

22

Algoritmo 3.2 (Metodo di bisezione, implementazione definitva). 

function[x,i]=bisezione(f,a,b,tolx) 

%BISEZIONE implementa il metodo per la ricerca 

%della radice di una funzione 

%INPUT 

% f funzione che contiene uno zero 

% a,b estremi dell’intervallo di confidenza 

% tolx tolleranza sul valore x tale che 

% f(x)=0 

%OUTPUT 

% x ascissa per la quale si verifica f(x)=0 

% i numero di iterazioni dell’algoritmo 

if tolx

Dalla 3.1, ricaviamo facilmente il fattore di amplificazione per il metodo di 

bisezione. Infatti f(x) può essere inteso come la perturbazione sui dati in ingresso 

(tenendo conto che il dato esatto in ingresso è f(x ∗ ) = 0), e |x − x ∗ | come 

la perturbazione sui dati in uscita. Di conseguenza il fattore di amplificazione 

per la radice di una funzione è: 

k = 

1 

|f ′ (x ∗ )| 

Definizione 5. (Molteplicità di una radice) 

x ∗ è una radice di molteplicità esatta m (m ∈ R) se 

f (0) (x ∗ ) = f (1) (x ∗ ) = . . . = f (m−1) (x ∗ ) = 0 e f (m) (x ∗ ) = 0 

La radice viene chiamata semplice se m = 1, multipla se m > 1. 

Teorema 5. Se x ∗ è una radice di molteplicità esatta m per f(x), allora 

si può scrivere così: 

f(x) = (x − x ∗ ) m · g(x) 

(3.3) 

f(x) = f(x ∗ )+f ′ (x ∗ )(x−x ∗ )+. . .+ f(m−1) 

(m − 1)! (x∗ )(x−x∗) m−1 + f(m) 

m! (ζx)(x−x ∗ ) m 

se la radice ha molteplicità m allora tutte le derivate fino alla m−esima si 

annullano. 

Quando viene usato un metodo iterativo, risulta interessante e addirittura 

necessario sapere se, man mano che iteriamo l’algoritmo, l’approssimazione 

converge alla soluzione, e con quale velocità converge. Per questo definiamo l’ 

errore dell’i-esima iterazione come: 

ei = xi − x ∗ 

Diremo perciò che il metodo numerico converge se 

(3.4) 

lim 

i→∞ ei = 0 (3.5) 

Definizione 6. (Ordine di convergenza) 

Un metodo iterativo ha ordine di convergenza p con costante asintotica c, se si 

verifica che 

Quando i ≫ 1 abbiamo che 

|ei+1| 

lim 

i→∞ |ei| p = c < ∞ 

|ei+1| ≈ c · |ei| 

|ei+2| ≈ c · |ei+1| ≈ c 2 · |ei| 

|ei+k| ≈ c k · |ei| 

dove c k · |ei| → 0 per k → ∞ se e solo se 0 ≤ c < 1 

24

Esempio 11 (Bisezione - radice di funzione lineare). Consideriamo in questo 

esempio una funzione lineare nell’intervallo [−5, 5]. Nello specifico la funzione 

è 

f(x) = x + 1 

Il grafico risultante è la figura 3.1 Sono stati eseguiti dei test per valutare la 

6 

5 

4 

3 

2 

1 

0 

−1 

−2 

−3 

X: −1.004 

Y: −0.003636 

−4 

−5 −4 −3 −2 −1 0 1 2 3 4 5 

Figura 3.1: Grafico della funzione lineare y=x+1. 

Il valore nel riquadro solamente un indicazione della radice 

radice di questa funzione. In particolare è stato interessante vedere il numero 

di iterazioni, che l’algoritmo impiegava per trovare la radice, al variare della 

tolleranza richiesta 

tolx iterazioni f(xi) 

10 −1 5 −0.93750000000000 

10 −5 19 −1.00000381469727 

10 −10 35 −1.00000000005821 

Esempio 12 (Bisezione - radice di polinomio di terzo grado). Un altro esempio 

dell’applicazione del metodo di bisezione sulla seguente funzione 

f(x) = 1 

10 x3 + 3x 2 − 100 

considerata nell’intervallo [−30, 15]. Il grafico risultante è la figura 3.2 Come 

nell’esempio precedente sono stati effettuati dei test con diverse tolleranze. Di 

seguito vi è la tabella con i risultati ottenuti 


10 −1 8 28.76953125000000 

10 −5 21 −28.79384279251099 

10 −10 21 −28.79384279251099 

25

1000 

800 

600 

400 

200 

0 

X: −28.79 

Y: 0.06525 

−200 

−30 −25 −20 −15 −10 −5 0 5 10 15 

Figura 3.2: Grafico della funzione cubica y = 1 

10 x3 + 3x 2 − 100. 

Il valore nel riquadro è solamente un indicazione della radice 

È interessante notare come il valore f(xi) non cambi portando la tolleranza da 

10 −5 a 10 −10 . In accordo con l’analisi sul condizionamento della radice, si nota 

come la derivata del polinomio di terzo grado nella sua radice, sia relativamente 

alta. Questo fa in modo che il vincolo sulla tolleranza sia meno stringente. 

Esempio 13 (Bisezione - radice della funzione trigonometrica coseno). L’ultimo 

esempio che viene proposto riguarda la funzione 

f(x) = cos(x) 

considerata nell’intervallo [0, 6]. Il grafico risultante è la figura 3.3 

Come nell’esempio precedente sono stati effettuati dei test con diverse tolleranze. 

Di seguito vi è la tabella con i risultati ottenuti 


10 −1 6 1.59375000000000 

10 −5 18 1.57079315185547 

10 −10 34 1.57079632685054 

26

1 

0.8 

0.6 

0.4 

0.2 

0 

−0.2 

−0.4 

−0.6 

−0.8 

X: 1.57 

Y: 0.0006128 

−1 

0 1 2 3 4 5 6 

Figura 3.3: Grafico della funzione cubica y = cos(x). 

Il valore nel riquadro è solamente un indicazione della radice 

3.2 Metodo di Newton 

Il metodo di Newton-Raphson, anche conosciuto come metodo delle tangenti, 

si occupa di trovare la radice della funzione data. Per il suo scopo utilizza, appunto, 

delle tangenti a partire da un’approssimazione iniziale, x0. Per calcolare 

la successiva approssimazione, si eseguono i seguenti passi: 

• prendiamo l’intersezione della funzione f(x) con la retta x = x0 

• individuiamo un nuovo punto, sia esso P, sulla curva della funzione f(x), 

con coordinate (x0, f(x0)) 

• tracciamo la retta tangente alla funzione f(x) nel punto P appena individuato 

• l’intersezione della retta tangente con l’asse delle ascisse sarà la nuova 

approssimazione della radice della funzione. 

Consideriamo l’equazione di una retta passante per un punto specificato: 

y − f(x0) = m · (x − x0) (3.6) 

Il coefficiente angolare nel nostro caso sarà il valore della derivata della 

funzione nel punto x0. Sostituendolo al posto del parametro m, otteniamo 

y − f(x0) = f ′ (x0) · (x − x0) 

A questo punto è facile trovare la nuova approssimazione della radice, perché 

basterà porre y = 0 nella precedente equazione per ottenere, con un pò di 

passaggi algebrici la formula 

27

x = x0 − f(x0) 

f ′ (x0) 

Iterando il procedimento troviamo la formula generale 

xi+1 = xi − f(xi) 

f ′ (xi) 

(3.7) 

Il metodo di newton però richiede che il punto di innesco, x0 sia vicino 

alla radice x ∗ . Più precisamente si richiede che la derivata della funzione f(x) 

non cambi il segno nell’intervallo [x0, x ∗ ], se x0 ≤ x ∗ , [x ∗ , x0] altrimenti. A 

differenza del metodo di bisezione, il metodo delle tangenti, richiede il calcolo 

sia della funzione, che della sua derivata. Quindi la funzione in esame deve essere 

non solo continua nell’intervallo che stiamo considerando, ma anche derivabile. 

Teorema 6. Se f(x) è regolare, il metodo di Newton converge quadraticamente 

verso radici semplici. 

Dim.: Sia x ∗ la radice verso la quale il metodo converge. Per ipotesi la 

funzione f(x) ∈ C 2 , quindi esiste ξi compreso tra x ∗ e xi per il quale vale: 

0 = f(x ∗ ) = f(xi) + f ′ (xi)(x ∗ − xi) + 1 

2 f ′′ (ξi)(x ∗ − xi) 2 

= f ′ (xi) 

 

f(xi) 

f ′ (xi) − xi + x ∗ 

 

+ 1 

2 f ′′ (ξi)(x ∗ − xi) 2 

Considerando la 3.7 e che xi − x ∗ = ei, otteniamo 

ei+1 

e 2 i 

= f ′′ (ξi) 

2f ′ (xi) 

(3.8) 

Sono semplici passaggi algebrici ma risultano più chiari se visti nel seguente 

modo 

f ′ (xi)( f(xi) 

f ′ − xi +x 

(xi) 

 

∗ 

) + 1 

−xi+1 

 

−ei+1 

2 f ′′ (ξi)(x ∗ − xi) 2 

 

(−ei) 2 

La 3.8 è ben definita, perché per ipotesi f ′ (x) = 0 Quindi nel caso in cui il 

metodo è convergente risulta che 

e1+1 

lim 

i→∞ e2 = 

i 

f ′′ (x∗ ) 

2f ′ (x∗ ) 

Dalla definizione 6 risulta evidente che l’ordine di convergenza è p = 2. 

3.2.1 Convergenza locale 

Abbiamo visto che il metodo di bisezione, converge globalmente sotto alcune 

ipotesi. Al contrario, per il metodo di Newton, la convergenza è garantita solo 

localmente ad determinato intorno. Al fine di provare sotto quale ipotesi, il 

28

suddetto metodo converge, dobbiamo considerare la funzione di iterazione Φ, 

che è caratteristica del metodo numerico: 

Φ(xi) = xi − f(xi) 

f ′ (xi) 

(3.9) 

Questa funzione deve godere di una proprietà fondamentale affinché il metodo 

iterativo converga: 

Enunciamo e dimostriamo il seguente teorema: 

x ∗ = Φ(x ∗ ) (3.10) 

Teorema 7 (del punto fisso). Sia Φ(x), la funzione di iterazione. Se esistono 

δ > 0 e 0 ≤ L < 1, tali che per ogni x, y ∈ (x ∗ − δ, x ∗ + δ) ≡ I e tali che 

|Φ(x) − Φ(y)| ≤ L · |x − y| 

allora: 

1 x ∗ è l’unico punto fisso di Φ in I. 

2 se x0 ∈ I allora xi ∈ I ∀i ≥ 0 

3 limi→∞xi = x ∗ 

Dim: 

1 (per assurdo): Supponiamo che esista un altro punto fisso ¯x = Φ(¯x) ∈ I. 

Otteniamo che 

ovvero 

|x ∗ − ¯x| = |Φ(x ∗ ) − Φ(¯x)| ≤ L · |x ∗ − ¯x| < |x ∗ − ¯x| 

|x ∗ − ¯x| < |x ∗ − ¯x| 

che è impossibile. 

2 (per induzione): Dalle ipotesi sappiamo che x0 ∈ I. Questo implica che 

|x ∗ − x0| < δ Ricordando che 0 ≤ L < 1, abbiamo che: 

|x ∗ − x1| = Φ(x ∗ ) − Φ(x0) ≤ L · |x ∗ − x0| < L · δ < δ 

3: xi → x ∗ per i → ∞. Abbiamo che 

|xi − x ∗ | = |Φ(xi−1) − Φ(x ∗ )| ≤ L · |xi−1 − x ∗ | 

= L · |Φ(xi−2 − Φ(x ∗ )| ≤ L 2 · |xi−1 − x ∗ | 

= . . .L i · |x0 − x ∗ | 

se i → ∞ allora L i → 0. La tesi segue banalmente. 

29

3.2.2 Criterio d’arresto 

Come per il metodo di bisezione, è necessario definire un criterio d’arresto. Per 

questo condiseriamo la seguente espressione: 

 

 

 

 

|xi+1 − xi| = xi+1 

− x 

 

 

∗ 

+x 

 

∗ 

 

 

 

− xi 

= |ei − ei+1| 

 

 

−ei+1 

Quando il metodo di Newton converge quadraticamente, nelle vicinanze della 

radice, l’addendo ei+1, risulta essere poco significativo, quindi ha senso compiere 

questa approssimazione 

ei 

|ei − ei+1| ≈ |ei| ≤ tolx 

Quindi il controllo |ei| ≤ tolx lo implementeremo con |xi+1 − xi| ≤ tolx. 

Dall’espressione 3.7, ricaviamo che 

Allora il nuovo controllo diviene: 

|xi+1 − xi| = |f(xi)| 

|f ′ (xi)| 

|f(xi)| ≤ tolx · |f ′ (xi)| (3.11) 

Vediamo allora la prima implementazione dell’algoritmo del metodo di Newton 

30

Algoritmo 3.3 (Metodo di Newton). 

%NEWTON implementa il metodo delle tangenti 

%per la ricerca della radice di una funzione 

%INPUT 


% df derivata della funzione f 

% x0 punto di partenza dell’algoritmo 

% toll tolleranza sul valore x tale che 

% f(x)=0 

% 

%OUTPUT 

% zero ascissa per la quale f(zero)=0 

% niter numero di iterazioni 

function [zero, niter]=newton(f,df,x0,toll,nmax) 

x = x0; 

fx = feval(f, x); 

fpx = feval(df, x); 

niter = 0; 

dif = toll+1; 

while dif > toll & niter

function f=dcubica2(x) 

f = (3/100).*x.^2; 

Ricordiamoci infatti che per applicare il metodo di newton serve anche specificare 

la derivata della funzione. Il grafico delle funzione cubica e della sua derivata 

è mostrato in figura 3.4 

Risulta interessante vedere come risponde il metodo di newton al variare del 

15 

10 

5 

0 

f(x)=x 3 /100 + 5 

D(f (x))=x 2 /100 

−5 

−10 −8 −6 −4 −2 0 2 4 6 8 10 

Figura 3.4: Grafico della funzione cubica e della sua derivata. 

punto di innesco e della tolleranza Ecco una tabella riassuntiva: 

radice iterazioni 

newton(’cubica2’,’dcubica2’,5,0.00001,100) -7.93700525984119 8 

newton(’cubica2’,’dcubica2’,-2,0.00001,100) -7.93700525984100 10 

newton(’cubica2’,’dcubica2’,-50,0.00001,100) -7.93700525984100 9 

newton(’cubica2’,’dcubica2’,-50,eps,100000) -7.93700525984100 100001 

newton(’cubica2’,’dcubica2’,-50,eps*10,100) -7.93700525984100 10 

È interessante notare come a parità di tolleranza (10 − 5) , ma con differente 

punto di innesco, le iterazioni varino di poco. Le ultime due righe della tabella 

invece, fanno notare come la radice −7.93700525984100 rientri sostanzialmente 

nella tolleranza della precisione di macchina. 

Esempio 15. Abbiamo visto che il metodo di newton converge alla radice della 

funzione solo sotto alcune ipotesi, una delle quali è che la derivata prima della 

funzione che ammette radice, non cambi di segno. Se la derivata prima cambia 

di segno infatti, si può avere un ciclo infinito. Questo comportamento viene 

evidenziato bene in figura 3.5 

Si vede benissimo infatti che l’intersezione delll’asse delle ascisse con la tangente 

alla funzione coseno nel punto x0, produce una nuova approssimazione 

x1. Ancora una volta vediamo che l’intersezione delll’asse delle ascisse con 

32

1 

0.8 

0.6 

0.4 

0.2 

0 

−0.2 

−0.4 

−0.6 

−0.8 

−1 

x 0 

( x 0 , f ( x 0 ) ) 

( x 1 , f ( x 1 ) ) 

3.5 4 4.5 5 5.5 6 

Figura 3.5: Grafico dell’applicazione del metodo di newton 

alla funzione coseno. 

la tangente alla funzione coseno nel punto x1, produce l’ approssimazione x0. 

Quindi in questo caso il metodo di newton non converge. Questo esempio è stato 

generato in matlab con il seguente listato dell’algoritmo 3.4. 

33 

x 1

Algoritmo 3.4. 

function[a]=esempio(tol,passo) 

%Esempio di come il metodo di newton non converga 

%in presenza di un cambio di segno della derivata 

%in due punti x0 e x1. 

format long e; 

ok=0; 

x0max=3.5468277953; 

for x0=3.546827795175:passo:x0max 

fx0=cos(x0); 

x1=x0-(fx0/-sin(x0)); 

fx1=cos(x1); 

x01=x1-(fx1/-sin(x1)); 

if abs(x0-x01)

y=[0:0.01:cos(x1)]; 

plot(x1,y,’r--’); 

y=[0:-0.01:cos(x0)]; 

plot(x0,y,’r--’); 

L’output invece è il seguente 

>> esempio(eps*10,eps) 

x0 3.5468277951774785000e+000 

x1 5.8779501655919013000e+000 

fx0 -9.1900972156043170000e-001 

fx1 9.1900972156043181000e-001 

f1x0 3.9423486867274654000e-001 

f1x1 3.9423486867274649000e-001 

ans = 

>> 

3.546827795177479e+000 

3.2.3 Ancora sul criterio d’arresto 

Il criterio d’arresto 3.11, è un controllo sull’errore assoluto. Quando la radice 

della funzione ha un valore molto grande, risulta poco efficiente un controllo del 

genere. Per questo motivo vorremmo un controllo sull’errore assoluto quando la 

radice è vicino a zero, mentre vorremmo un controllo sull’errore relativo quando 

la radice è un numero molto grande 

 

∗ tolx, se x ≈ 0 

|xi+1 − xi| ≤ 

rtolx · |xi+1| , se x∗ ≫ 1 

Quindi si preferisce utilizzare il seguente controllo: 

|ei| 

tolx + rtolx · |x∗ ≤ 1 (3.12) 

| 

Quando siamo molto vicini alla radice della funzione, ha senso approssimare 

x ∗ con xi+1 e |ei| con |xi+1 − xi|. Inoltre viene anche considerata l’uguaglianza 

rtolx = tolx. Per cui, sostituendo le varie approssimazioni e facendo qualche 

passaggio algebrico, otteniamo il nuovo criterio d’arresto: 

|xi+1 − xi| 

1 + |xi+1| 

≤ tolx (3.13) 

In questo modo quando x ∗ ≈ 0 si ha un controllo simile a |xi| ≤ tolx, mentre 

quando x ∗ ≫ 1, viene effettuato un controllo relativo. 

35

3.2.4 Radici multiple 

Se la funzione ammette più di una radice, il metodo di newton risulta malcondizionato, 

e il fattore p , detto ordine di convergenza (definizione 6), assume 

valore 1. È però possibile, attraverso alcune modifiche riportare la convergenza 

quadratica. 

• Molteplicità della radice nota Supponiamo, per semplicità, di avere 

una funzione siffatta: 

f(x) = (x − x ∗ ) m 

Se applichiamo il metodo di newton, abbiamo che 

x1 = x0 − 

(x0 − x ∗ ) m 

m · (x0 − x ∗ ) m−1 = x0 − 1 

m · (x0 − x ∗ ) 

 

f(x 0 ) 

f ′ (x 0 ) 

Quindi, conoscendo la molteplicità esatta, é possibile ottenere la soluzione 

moltiplicando per il fattore m. 

xi+1 = xi − m · f(xi) 

f ′ , i = 0, 1, 2 . . . 

(xi) 

Con questa modifica si ripristina la convergenza quadratica verso una delle 

radici. 

• Molteplicità della radice non nota Siccome in questo caso, il metodo 

converge solo linearmente, abbiamo che ei ≈ c · ei−1 e ei+1 ≈ c · ei. 

dividendo membro a membro otteniamo che: 

e1 

ei+1 

≈ ei−1 

ei 

considerando l’equazione 3.4, con i seguenti passaggi arriviamo al risultato 

voluto: 

(xi−1 − x ∗ )(xi+1 − x ∗ ) ≈ (xi − x ∗ ) 2 

xi+1xi−1 − x ∗ (xi+1 + xi−1) + (x ∗ ) 2 ≈ x 2 i − 2xix ∗ + (x ∗ ) 2 

xi+1xi−1 − x 2 i ≈ x ∗ · (xi+1 + xi−1) − 2xix ∗ 

xi+1xi−1 − x 2 i ≈ x∗ · (xi+1 + xi−1 − 2xi) 

x ∗ ≈ x ∗ i ≈ 

xi+1xi−1 − x 2 i 

xi+1 + xi−1 − 2xi 

(3.14) 

A partire da un punto iniziale x0, si calcolano due approssimazioni, siano esse 

x (0) 

1 e x (0) 

2 . Con quest’ultime due approssimazioni, e x0, si può calcolare x (1) 

0 . 

È possibile reiterare il procedimento semplicemente ponendo x0 = x (1) 

0 . 

36

Algoritmo 3.5 (Metodo di Newton: accelerazione di Aitken). 

%AITKEN 

%function [x,passi]=Aitken(f,df,x0,epsilon,upper) 

% 

% Trova la radice della funzione f 

%INPUT 





% f(x)==0 

% imax numero massimo di iterazioni 

% 

%OUTPUT 


% iterazioni numero di iterazioni 

function [x,iterazioni]=Aitken(f,df,x0,toll,imax) 

f0=feval(f,x0); 

d=feval(df,x0); 

x1=x0-(f0/d); 



x2=x1-(f1/d); 


i=0; 

while (iabs(toll*d) 

i=i+1; 

x0=(x1*x1-x0*x2)/(2*x1-x2-x0); 



x1=x0-(f0/d); 



x2=x1-(f1/d); 


end 

x=x2; 

iterazioni=i+2; 

return 

Il metodo di accelerazione di aitken in sostanza ripristina la convergenza 

quadratica nel caso in cui la funzioni presenti radici multiple con molteplicità 

37

sconosciuta. Osserviamo che possiamo utilizzare lo stesso criterio d’arresto del 

metodo di newton 3.3 in quanto la convergenza non è più lineare ma quadratica 

Esempio 16. In questo esempio confrontiamo il metodo di Newton base, con 

quello dell’accelerazione di Aitken. La funzione in esame è la seguente: 

y = (x − 5) 5 

(3.15) 

I file pol5.m e dpol5.m, infatti rappresentano la precedente funzione e la sua 

derivata. Eccone il contenuto: 

function f = pol5(x) 

f=(x -5).^5; 

function f = dpol5(x) 

f=5.*(x-5).^4; 

Mostriamo il grafico delle due funzioni sopracitate: La cosa sorprendente è la 

5 

4 

3 

2 

1 

0 

−1 

4 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6 

Figura 3.6: Grafico della funzione 3.15 e della sua derivata. 

differenza nel numero di iterazioni che i metodi, di Newton e Aitken, impiegano 

per trovare la radice con tolleranza 10 −14 . Di seguito mostriamo l’output delle 

prove effettuate: 

>> [radice,iterazioni]=newton(’pol5’,’dpol5’,6,10^-14,10000); 

>> radice 

radice = 

5.0000 

>> iterazioni 

38 

X: 5 

Y: 0 

(x−5) 5 

5⋅(x−5) 4

iterazioni = 

139 

>> [radice,iterazioni]=Aitken(’pol5’,’dpol5’,6,10^-14,10000); 

>> radice 

radice = 

5.0000 

>> iterazioni 

iterazioni = 

3 

3.3 Metodi quasi-Newton 

Ci sono alcune varianti del metodo di Newton, che risultano computazionalmente 

meno dispendiose, ma anche meno performanti. In generale lo schema 

da seguire è il seguente: 

xi+1 = xi − f(xi) 

, i = 0, 1, 2, . . ., ϕi ≈ f ′ (xi) (3.16) 

φi 

Con questa generalizzazione affrontiamo due metodi: 

• Metodo delle corde L’idea di base è quella di calcolare solo una volta 

la derivata della funzione. Infatti, localmente alla radice, la derivata 

prima della funzione, varierà di poco. Per questo la derivata convergerà 

alla radice della funzione con la stessa inclinazione. Si procede con 

l’approssimazione f ′ (xi) ≈ f ′ (x0) per definire il seguente metodo: 

xi+1 = xi − f(xi) 

f ′ , i = 0, 1, 2, . . . (3.17) 

(x0) 

Questo metodo valuta solo una volta la derivata prima e per questo richiede 

poche risorse. Ma se da un lato richiede poche risorse, dall’altro lato 

non offre grandi prestazioni. Infatti il metodo delle corde converge solo 

linearmente 

• Metodo delle secanti L’idea che è alla base di questo metodo, è di ottenere 

la successiva approssimazione della radice, a partire da una secante 

la curva. Praticamente i passi da seguire sono i seguenti: 

. Al primo passo si individuano due punti, x0 e x1. 

. Si valuta la secante della curva nei punti (f(x1), x1) e (f(x0), x0). 

39

. La prossima approssimazione è calcolata come l’intersezione della 

secante con l’asse delle ascisse. 

La funzione ϕ definita nello schema generale dei metodi quasi-newton 

nell’equazione 3.16, in questo caso risulta essere così fatta: 

f ′ (xi) ≈ f(xi) − f(xi−1) 

xi − xi−1 

Pertanto l’iterazione dell’algoritmo diviene 

≡ ϕi. (3.18) 

xi+1 = f(xi) · xi−1 − f(xi−1) · xi 

, i = 1, 2, . . . (3.19) 

f(xi) − f(xi−1) 

Come vedremo nell’algoritmo 3.7, per determinare il punto x1, viene usato 

un passo dell’algoritmo di Newton. 

40

Algoritmo 3.6 (Metodo delle corde). 

%CORDE 

%[x,passi]=corde(f,df,x0,toll,imax) 


%INPUT 





% f(x)==0 


% 

%OUTPUT 



function [radice,iterazioni]=corde(f,df,x0,toll,imax) 

i=0; 


while(itoll) 

i=i+1; 

x0=x0-(feval(f,x0)/d); 

end 

radice=x0; 

iterazioni=i; 

return 

41

Algoritmo 3.7 (Metodo delle Secanti). 

%SECANTI 

%[x,passi]=secanti(f,df,x0,toll,imax) 


%INPUT 





% f(x)==0 


% 

%OUTPUT 



function [radice,iterazioni]=secantiEsempio(f,df,x0,toll,imax) 

i=0; 

% 

while(itoll) 

i=i+1; 

x2=((fx1*x0)-(fx0*x1))/(fx1-fx0); 

fx2=feval(f,x2); 

fx1=feval(f,x1); 

x0=x1; 

fx0=fx1; 

x1=x2; 

fx1=fx2; 

end 

radice=x1; 

iterazioni=i; 

return 

Esempio 17 (Corde vs Secanti: due metodi quasi-Newton a confronto). Come 

si evince dal titolo, in questo esempio verranno messi a confronto il metodo delle 

secanti e quello delle corde. Il confronto sarà effettuato sulla medesima funzione 

e con lo stesso punto di innesco. la funione è la seguente: 

function f = iperbole(x) 

f=10./x -2; 

42

Di seguito mostriamo le chiamate dei due metodi, e il loro output 

>> [x,iterazioni]=cordeEsempio(’iperbole’,’diperbole’,1,10^-4,1000) 

x = 

4.9998 

iterazioni = 

>> 

217 

>> [x,iterazioni]=secantiEsempio(’iperbole’,’diperbole’,1,10^-4,1000) 

x = 

5.0000 

iterazioni = 

>> 

7 

Con un altro codice sono stati generati i rispettivi grafici, che ci fanno capire 

meglio come lavorano i due metodi. 

Dai due grafici 3.7 e 3.8, possiamo subito notare il modo in cui viene usata 

la retta per l’approssimazione della nuova radice. Infatti nel metodo delle corde, 

l’inclinazione della retta rimane la solita fino alla radice, mentre nel metodo 

delle secanti è adattiva. Dal punto di vista computazionale, osserviamo che il 

metodo delle corde impiega 217 iterazioni contro le 7 del metodo delle secanti. 

In realtà il confronto in questo caso è impari. Infatti se scegliessimo un punto 

d’innesco più vicino alla radice, potremmo vedere la differenza, tra i due metodi, 

assottigliarsi. Concludiamo facendo un analisi sulle operazioni impiegate: 

Corde: Vediamo nell’algoritmo 3.6, che c’è subito una valutazione di funzione, 

e poi per ogni iterazioni, l’algoritmo effettua due confronti, una moltiplicazione, 

due valutazioni di funzione, e due somme. Se utiliziamo la 

seguente legenda, C = confronti, M = moltiplicazione o divisione, 

V = valutazione i funzione, S = somma o sottrazione, possiamo esprimere 

il costo dell’algoritmo in forma parametrica. Alla luce di questa 

analisi l’algoritmo delle corde ha un costo di: 

Costo(i, C, M, V, S) = V + i · (2C + M + 2V + 2S) (3.20) 

Secanti: A differenza del metodo delle corde, ci sono più costi fissi, ovvero più 

operazioni che non dipendono dal numero di iterazioni. Abbiamo inoltre 

43

8 

7 

6 

5 

4 

3 

2 

1 

0 

−1 

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 

Figura 3.7: Grafico della funzione 18 e dell’applicazione del metodo delle corde. 

due moltiplicazioni e/o divisioni e una somma e/o sottrazione in più del 

metodo delle corde. 

Costo(i, C, M, V, S) = 3V + M + S + i · (2C + 3M + 2V + 3S) (3.21) 

Nel nostro caso, se sostituiamo i valori di i che sono le iterazioni compiute, 

troviamo quante operazioni sono state fatte. 

C M V S 

corde 534 217 535 534 

secanti 14 22 17 21 

Il vero vantaggio, nell’usare il metodo delle corde piuttosto che quello delle secanti, 

risiede nel fatto che il punto di innesco deve essere molto vicino alla radice. 

Tanto più il valore della derivata è costante nell’intervallo [x0, x ∗ ], tanto più 

risulterà conveniente il metodo delle corde. 

44

8 

7 

6 

5 

4 

3 

2 

1 

0 

−1 

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 

Figura 3.8: Grafico della funzione 18 e dell’applicazione del metodo delle secanti. 

45

Capitolo 4 

Sistemi lineari 

Un sistema lineare di m equazioni in n incognite è un insieme di relazioni 

algebriche nella forma 

n 

aijxj = bi, i = 1, . . .,m (4.1) 

j=1 

dove xj sono le incognite, aij i coefficienti del sistema e bi i termini noti. D’ora 

in poi faremo riferimento al sistema 4.1 con la seguente notazione in forma 

matriciale: 

Ax = b (4.2) 

dove A = (aij) ∈ R mxn la matrice dei coefficienti, b = (bi) ∈ R m il vettore dei 

termini noti, e con x = (xi) ∈ R n il vettore incognito. La soluzione del sistema 

4.2 è una qualsiasi n-pla di valori che soddisfa l’equazione 4.1. 

Prenderemo in considerazione i casi in cui m ≥ n e che la matrice abbia 

rango massimo, ovvero rank(A) = n. Una soluzione del sistema può essere 

ottenuta tramite la regola di Cramer 

xj = ∆j 

, j = 1, . . .,n (4.3) 

det(A) 

dove ∆j è il determinante della matrice ottenuta sostituendo la j-esima colonna 

di A con il termine noto b. Tuttavia questo metodo risulta essere assai inefficiente, 

ed è per questo che andremo a considerare metodi alternativi alla regola 

di Cramer. 

4.1 Casi elementari 

A seconda delle proprietà che alcuni tipi particolari di matrici posseggono, possiamo 

definire metodi numerici studiati ad hoc per la loro risoluzione. Studieremo 

il caso di matrici diagonali, triangolari e ortogonali. 

4.1.1 Matrici diagonali 

Una matrice diagonale presenta la caratteristica di avere gli elementi 

46

aij se i = j 

aij = 

0 altrimenti 

Possiamo rappresentarle con un sistema grafico nel seguente modo: 

⎛ ⎞ 

A = 

⎜ 

⎝ 

a11 

. .. 

ann 

⎟ 

⎠ 

Di conseguenza il sistema lineare equivale alla forma 

aiixi = bi, per i = 1, . . .,n 

la soluzione di suddetto sistema si otterrà calcolando 

xi = bi 

aii 

per i = 1, . . .,n (4.4) 

Essendo la matrice A non singolare, il rapporto dell’equazione 4.4 è sempre ben 

definito. Il costo computazionale e in termini di occupazione di memoria, è 

lineare rispetto alla dimensione della matrice. 

47

Algoritmo 4.1 (Matrici diagonali). 

%function x=diagonale(A,B) 

% 

%Se A quadrata e B ha lo stesso numero 

%di righe delle colonne di B 

%allora questo algoritmo calcola la soluzione 

%dell’equazione Ax=B; 

%INPUT 

% A Matrice dei coefficienti 

% B Matrice dei termini noti 

%OUTPUT 

% x Matrice delle incognite 

function x=diagonale(A,B) 

[righeA,colonneA]=size(A); 

[righeB,colonneB]=size(B); 

if righeA==colonneA 

if colonneA==righeB 

for j = 1:n 

if A(i,i)==0 

error(’la matrice è singolare’) 

else 

x(i)=b(i)./A(i,i) 

end 

end 

else 

error(’Il numero di colonne della matrice A’) 

error(’non è uguale al numero di righe della matrice B’) 

end 

else 

error(’La matrice A non è quadrata’) 

end 

4.1.2 Matrici triangolari 

Con il termine triangolare si distinguono quelle matrici che godono di una delle 

seguenti proprietà: 

• Superiore: gli elementi aij con i > j sono tutti uguali a zero. 

⎛ ⎞ 

a11 . . . a1n 

⎜ 

A = ⎝ 

. .. 

. ⎟ 

. ⎠ 

48 

ann

• Inferiore: gli elementi aij con i < j sono tutti uguali a zero 

A = 

⎛ 

⎜ 

⎝ 

a11 

. 

. .. 

an1 . . . ann 

Analiziamo soltanto il caso in cui la matrice A risulti diagonale inferiore, in 

quanto l’altro caso è analogo. Otteniamo un sistema di equazioni nella seguente 

forma: 

a11x1 = b1 

⎞ 

⎟ 

⎠ 

a21x1 +a22x2 = b2 

a31x3 +a32x3 +a33x3 = b3 

. 

. .. 

an1xn +an2xn + . . . +annxn = bn 

Questo sistema può essere risolto con sostituzioni successive nel seguente modo: 

x1 = b1 

a11 

x2 = (b2 − a21x1) 

a22 

x3 = b3 − a31x1 − a32x2) 

. 

xn = 

a33 

 

bn − n−1 j=1 anjxj 

 

ann 

. 

. 

(4.5) 

Come per il metodo per la risoluzione delle matrici diagonali, essendo la matrice 

A non singolare, necessariamente aii sarà diverso da zero per ogni i = 1, . . .,n, 

quindi le divisioni nelle equazioni 4.5 sono ben definite. 

49

Algoritmo 4.2 (Matrici triangolari inferiori). 

% slts acronimo di Solve Lower Triangolar System 

%INPUT 

% A matrice dei coefficienti (triangolare superiore) 

% B vettore dei termini noti 

% flag se settato a uno controlla la struttura della matrice A 

%OUTPUT 

% x vettore delle incognite 

function [x]=slts(A,b) 

[m,n]=size(A); 

if(m~=n) 

error(’L matrice A non quadrata’); 

end 

for i=1:n 

for j=(i+1):n 

if A(i,j) ~=0 

error(’A non triangolare inferiore’); 

end 

end 

end 

if length(b) ~= n 

error(’B non e’’ compatibile’); 

end 

for i=1:n 

for j=1:i-1 

b(i)=b(i)-A(i,j)*x(j); 

end 

if A(i,i)==0 

error(’Il sistema triangolare inferiore presenta infinite soluzioni’); 

else 

x(i)=b(i)/A(i,i); 

end 

end 

50

Algoritmo 4.3 (Matrici triangolari superiori). 

%suts acronimo di Solve Upper Triangolar System 

%A una matrice triangolare superiore 

%x il vettore dei termini noti 

%i parametri di ritorno sono: 

% x il vettore delle inconite 

% t il tempo che l’algoritmo impiega per effettuare tale operazione 

function [x]=suts(A,b) 


if(m~=n) 

error(’L matrice A non quadrata’); 

end 

for i=1:n 

for j=1:i-1 

if A(i,j) ~=0 

error(’A non e’’ triangolare sup’); 

end 

end 

end 

if length(b) ~= n 

error(’B non e’’ compatibile’); 

end 

for i=n:-1:1 

for j=i+1:n 

b(i)=b(i)-A(i,j)*x(j); 

end 

if (A(i,i)==0) 

if(x(i)~=0) 

error(’Il sistema presenta infinite soluzioni’); 

else 

x(i)=0; 

end 

else 

x(i)=b(i)/A(i,i); 

end 

end 

4.1.3 Matrici ortogonali 

Una matrice A si dice ortogonale, se A −1 = A T , ovvero se A · A T = IA. Quindi 

nel caso che A sia una matrice ortogonale, l’equazione x = A −1 · b, diventa 

x = A T · b, e la soluzione viene trovata semplicemente effettuando una moltiplicazione 

tra la matrice dei coefficienti A trasposta e il vettore dei termini noti. 

51

Il costo computazionale per effettuare un prodotto matrice-vettore è dell’ordine 

di 2n 2 flop, mentre la memoria viene occupata per n 2 posizioni. 

4.2 Metodi di fattorizzazione 

Abbiamo visto fin qui, come trattare la fattorizzazione di matrici semplici, ovvero 

con determinate caratteristiche, in quanto risulta molto semplice ed efficiente, 

trovare la soluzione dell’equazione 4.2. Vorremmo trovare dei metodi che 

riescano a fattorizzare qualunque tipo (o quasi) di matrice nel seguente modo: 

A = F1F2 . . . Fk, (4.6) 

dove le Fi, sono matrici semplici (triangolari superiori o inferiori oppure ortogonali, 

non singolari). La soluzione dell’equazione 4.6, può essere calcolata 

risolvendo i seguenti sistemi lineari: 

F1x1 = b 

F2x2 = x1 

. 

Fkxk = xk−1 

x ≡ xk 

Come detto in precedenza, questi sistemi lineari sono efficientemente risolvibili, 

in più l’occupazione di memoria non ne risente, in quanto una volta calcolato il 

vettore xi, non abbiamo più bisogno dei precedenti. 

4.3 Fattorizzazione LU di una matrice 

La fattorizzazione LU, consite nella trasformazione della matrice A nel prodotto 

di due fattori, L e U, dove L è una matrice triangolare inferiore con diagonale 

unitaria, e U è una matrice triangolare superiore (L ed U stanno per lower e 

upper). 

Teorema 8. La somma e il prodotto di matrici triangolari inferiori (superiori) 

è una matrice triangolare inferiore (superiore). 

Dim. Essendo triangolari inferiori si ha che: 

L1 = (aij) e L2 = (bij) =⇒ aij, bij = 0 per j > i 

Somma : è banale verificare che L2 + L1 = (aij + bij) e aij + bij = 0 per j > i 

Prodotto : dobbiamo dimostrare che se L1 · L2 = (cij) allora cij = 0 quando j > i. 

se j > i allora 

⎛ ⎞ 

cij : e T i (L1·L2)e i = (e T i ·L1)·(L2·e i ) = (ai1, ai2, . . .,aii, 0, . . .,0 

52 

b1j 

⎜b2j⎟ 

⎜ ⎟ 

⎜ . ⎟ 

⎜ . ⎟ 

)· ⎜ 

⎜bjj 

⎟ = 0 

⎜ 

n−i ⎜ 0 ⎟ 

⎜ ⎟ 

⎝ . ⎠ j − i 

0

Praticamente vuol dire che non c’è alcun intersezione tra gli elementi nulli 

bij e aij. 

Teorema 9. La somma e il prodotto di matrici triangolari inferiori (superiori) 

a diagonale unitaria, è una matrice triangolare inferiore (superiore) a diagonale 

unitaria. La dimostrazione analoga alla precedente. 

Teorema 10. Se L è non singolare triangolare inferiore (superiore), allora L −1 

è triangolare inferiore (superiore). Consegue che L ·L −1 = I. Essendo L = (aij 

e L −1 = (bij), allora bii · aii = 1 =⇒ bii = 1/aii 

Teorema 11 (Unicità della fattorizzazione LU). Se A è non singolare e fatorizzabile 

LU allora i fattori L ed U sono univocamente determinati. 

Dim.(per assurdo) Dimostriamo che se esistessero due fattorizzazioni, allora 

queste sarebbero uguali. Infatti se A = L1U1 = L2U2 fossero due fattorizzazioni 

si avrebbe che 

0 = det(A) = det(L2U2) = det(L2)det(U2) = det(U2) 

Ricordiamoci infatti, che essendo L una matrice triangolare inferiore a diagonale 

unitaria, il suo determinante sarà 1. Quindi U2 è non singolare. 

L −1 

1 L2 = U1U −1 

2 ≡ D 

Siccome L −1 

1 L2 è triangolare inferiore e U1U −1 

2 è triangolare superiore, allora 

questi due prodotti devono assolutamente essere una matrice diagonale. 

Essendo L −1 

1 L2 a diagonale unitaria, lo sarà anche D. Quindi se D è una 

matrice diagonale con elementi uguali a uno, questa corrisponde proprio alla 

matrice identità, cioè D = I. Allora abbiamo che: 

L −1 

1 L2 = D = I =⇒ L2 = L1I = L1 e U1U −1 

2 = D = I =⇒ U1 = U2I = U2 

Sappiamo dell’unicità della fattorizzazione, ma non dell’esistenza. Vediamo 

allora un metodo che ci consente, se possibile, di trovare la fattorizzazione di una 

matrice. In generale attraverso una procedura semi-iterativa, trasformeremo, 

tramite n − 1 moltiplicazioni a sinistra con L i , la matrice A nella matrice U. 

I fattori L i , moltiplicati tra loro, non sono altro che L −1 . Infatti abbiamo 

che L −1 · A = U, ovvero A = LU. Vediamo più in dettaglio il procedimento 

dell’algoritmo. Ricordiamoci che L deve essere una matrice triangolare inferiore 

a diagonale unitaria. Vogliamo azzerare tutte le componenti di un vettore v 

dalla k + 1 − esima in poi. Ci serviremo di una matrice L, tale che 

⎛ ⎞ 

v1 

⎜ ⎟ 

⎜ . ⎟ 

⎜vk⎟ 

Lv = ⎜ ⎟ 

⎜ 0 ⎟ 

⎜ ⎟ 

⎝ . ⎠ 

0 

Definiamo, per questo scopo, il vettore elementare di Gauss come 

g ≡ 1 

(0, . . .,0 

vk 

k 

, vk+1, . . .,vn) T 

53 

g ∈ R k+n×1 

(4.7) 

(4.8)

e la matrice elementare di Gauss 

L ≡ I − ge T k 

Graficamente la matrice 4.9 appare così: 

⎛ 

1 

⎜ 

L = ⎜ 

⎝ 

. .. 

1 

− vk+1 

vk 

. 

− vn 

vk 

Verifichiamo che l’equazione 4.7 è soddisfatta: 

⎛ 

Lv = (I−ge T k )·v = v−g· (eT k v) 

 

è uno scalare 

. .. 

⎜ 

= v−gvk = ⎜ 

⎝ 

v1 

. 

. 

vk 

. .. 

vk+1 

. 

vn 

⎞ 

1 

⎞ 

⎟ 

⎠ 

⎛ 

⎟ 

⎟−vk· 

⎟ 

⎠ 

1 

⎜ 

vk 

⎜ 

⎝ 

0 

. 

. 

0 

vk+1 

. 

vn 

⎞ 

(4.9) 

⎛ 

v1 

⎞ 

⎟ ⎜ . ⎟ 

⎟ ⎜ 

⎟ ⎜ . ⎟ 

⎟ ⎜vk⎟ 

⎟ = ⎜ ⎟ 

⎜ 

⎟ ⎜ 0 ⎟ 

⎟ ⎜ ⎟ 

⎠ ⎝ . ⎠ 

0 

Vediamo ancora più in dettaglio le trasformazioni che la matrice A subisce per 

diventare la matrice U. Al primo passo la matrice si presenta così: 

A ≡ A (1) ⎛ 

a 

⎜ 

= ⎜ 

⎝ 

(1) 

11 . . . a (1) 

⎞ 

1n 

⎟ 

. . ⎠ 

(4.10) 

a (1) 

n1 . . . a (1) 

nn 

L’indice tra parentesi indica l’ultima iterazione che ha modificato l’elemento. 

Come detto in precedenza, al primo passo, si deve moltiplicare a sinistra la 

matrice 4.10 per una matrice triangolare inferiore a diagonale unitaria, in modo 

tale che la matrice risultante abbia la prima colonna strutturalmente uguale 

alla prima colonna di un matrice triangolare superiore. Costruiamo per questo 

il primo vettore di Gauss 

g1 ≡ 1 

a (1) 

11 

e la corrispondente matrice di Gauss 

⎛ 

L1 ≡ I − g1e T 1 = 

⎜ 

⎝ 

(0, a (1) 

21 , . . . , a(1) n1 )T 

1 

− a(1) 

21 

a (1) 

11 

. 

− a(1) 

n1 

a (1) 

11 

54 

1 

. .. 

⎞ 

⎟ 

⎠ 

1 

(4.11) 

(4.12)

Moltiplicando la matrice 4.12 con la matrice 4.10 otteniamo: 

⎛ 

a 

⎜ 

L1A = ⎜ 

⎝ 

(1) 

11 . . . . . . a (1) 

0 a 

1n 

(2) 

22 . . . a (2) 

. . 

⎞ 

⎟ 

2n ⎟ ≡ A(2) 

. ⎠ 

0 a (2) 

n2 . . . a (2) 

nn 

(4.13) 

Siccome L1 ha la prima riga formata da un 1 seguito da zeri, la prima riga 

di A (2) , risulterà inalterata. 

⎛ 

a 

⎜ 

Li−1 . . . L2L1A = ⎜ 

⎝ 

(1) 

11 . . . . . . . . . . . . a (1) 

1n 

. 

0 .. 

. 

. 

. .. (i−1) 

a i−1,i−1 . . . . . . a (i−1) 

i−1,n 

. 0 a (i) 

ii . . . a (i) 

⎞ 

⎟ ≡ A 

⎟ 

in ⎟ 

. . . . . . ⎠ 

(i) 

(4.14) 

0 . . . 0 a (i) 

ni . . . a (i) 

nn 

A questo punto segue l’i-esimo passo.Se a (i) 

ii = 0 si può calcolare l’i-esimo vettore 

di Gauss e la i-esima matrice di Gauss 

gi ≡ 1 

a (i) 

ii 

Li ≡ I − gie T ⎛ 

1 

⎜ 

i = ⎜ 

⎝ 

(0 . . . , 0, 

a 

 

i 

(i) 

. .. 

i+1,i 

, . . .,a(i) 

ni )T 

1 

− a(i) 

i+1,i 

a (i) 

ii 

. 

. 

− a(i) 

ni 

a (i) 

ii 

. .. 

⎞ 

⎟ 

⎠ 

1 

Moltiplicando a sinistra A (i) con l’i-esima matrice di Gauss, otteniamo: 

LiA (i) ⎛ 

a 

⎜ 

= Li−1 . . . L2L1A = ⎜ 

⎝ 

(1) 

. 

0 .. 

. 

. 

. . 

. .. (i) 

a i,i . . . . . . a (i) 

in 

. 0 a (i+1) 

. 

. 

. . . . 

11 . . . . . . . . . . . . a (1) 

1n 

i+1,i+1 . . . a (i+1) 

i+1,n 

0 . . . 0 a (i+1) 

n,i+1 . . . a (i+1) 

nn 

⎞ 

(4.15) 

(4.16) 

⎟ ≡ A 

⎟ 

⎠ 

(i+1) 

(4.17) 

Le prime i righe della matrice 4.17, restano invariate perchè le prime i righe 

della i-esima matrice di Gauss corrispondono alla matrice identità. Iterando il 

55

procedimanto fin qui descritto, al passo i = n − 1, otteniamo: 

⎛ 

a 

⎜ 

Ln−1 . . . L1A = ⎜ 

⎝ 

(1) 

11 . . . . . . a (1) 

0 

. .. 

a 

1n 

. 

(n−1) 

⎞ 

⎟ 

⎠ ≡ A(n) ≡ U (4.18) 

n−1,n−1 a(n−1) n−1,n 

a (n−1) 

nn 

I fattori Li meritano una considerazione. Come detto in precedenza, tali 

fattori sono matrici tringolari inferiori a diagonale unitaria, e per i teoremi 8 

e 9 il prodotto n−1 i=1 Li è ancora una matrice triangolare inferiore a diagonale 

unitaria. In particolare abbiamo che 

Ma allora 

Invertendo le matrici abbiamo che 

L −1 A = U =⇒ A = LU 

L −1 = Ln−1Ln−2 . . .L1 

L = L −1 

n−1L−1 n−2 . . . L−1 1 

Vediamo più in dettaglio cosa sono L e L −1 

L = I − ge T k 

L −1 = I + ge T k 

Dalla definizione di matrice inversa, sappiamo che L ·L −1 = I. Quindi abbiamo 

che: 

(I − ge T k ) · (I + ge T k ) = (I + ge T k − ge T k − ge T k ge T k ) = I − g(e T k g 

 

0 

)e T k = I 

È interessante vedere sotto quali condizioni è possibile effettuare la fattorizzazione 

LU. 

Definizione 7 (sottomatrice di ordine k). Data A ∈ Rn×n si dice sottomatrice 

principale di ordine k, la matrice 

⎛ ⎞ 

a11 . . . a1k 

⎜ 

Ak = ⎝ . 

. 

⎟ 

. ⎠ ∈ R k×k 

ak1 . . . akk 

Teorema 12 (Esistenza della fattorizzazione LU). A è fattorizzabile LU se e 

solo se U è non singolare, se e solo se ∀K = 1, . . . , n Uk è non singolare. 

Dim. possiamo ottenere Ak a partire da A nel seguente modo: 

Ak = 

IK Ok,n−k · A · 

IK 

On−k,k 

Sostituiamo nella precedente equazione la matrice A con LU opportunamente 

partizionate 

⎛ 

⎞⎛ 

⎞ 

⎜ 

Ak = ⎜ 

⎝ 

IK Ok,n−k 

 

UK UK1 

 

LK 

· 

LK1 

 

⎟⎜ 

Ok,n−k ⎟⎜ 

⎟⎜ 

LK2 ⎠⎝ 

 

 

UK2 

 

L 

U 

56 

IK 

On−k,k 

⎟ 

⎠ =

= 

Uk 

Lk Ok,n−k · = LKUK = AK 

On−k,k 

Osserviamo che det(AK) = det(LKUK) = det(LK) · det(UK) = det(UK) 

Abbiamo ottenuto quindi che la sottomatrice di ordine k di U è non singolare 

se e solo se la sottomatrice di ordine k di A è non singolare. 

Algoritmo 4.4 (Fattorizzazione LU). 

function [A]=LU(A) 

%fattorizza la matrice A in due fattori: 

%una matrice triangolare inferiore a diagonale unitaria 

%una matrice triangolare superiore 

%INPUT 

% A matrice non singolare 

%OUTPUT 

% A matrice che contiene la fattorizzazioen LU 


if m==n 

for i=1:n-1 

if A(i,i)==0 

error(’la matrice non fattorizzabile LU’) 

end 

A(i+1:n,i)=A(i+1:n,i)/A(i,i); 

A(i+1:n,i+1:n)=A(i+1:n,i+1:n) - A(i+1:n,i)*A(i,i+1:n); 

end 

else 

error(’la matrice non quadrata’) 

end 

57

Algoritmo 4.5 (Matrici diagonali). 

function [x]=swlu(A,b) 

%swlu l’acronimo di Solve With LU 

%A la matrice quadrata da fattorizzare 

%b il vettore dei termini noti 

%x il parametro di ritorno x la soluzione 

A 

b 

lu=LU(A); 

%estraggo L e setto la diagonale a 1 

%visto che la diagonale unitaria non era 

%esplicitamente memorizzata 

L=tril(lu); 

L=L-diag(diag(L-1,0)) 

%estraggo U 

U=triu(lu) 

%adesso risolvo il sistema 

%A=LU, quindi LUx=b 

%Lx1=b e Ux=x1 

x1=slts(L,b); 

x=suts(U,x1); 

x’ 

58

Esempio 18 (Risoluzione sistema di equazioni). Mostriamo un esempio di 

risoluzione di un sistema di equazioni tramite la fattorizzazione LU. 

>> x=swlu(A,b); 

A = 

b = 

3 7 -2 -5 4 

-1 0 9 -4 3 

12 -1 -1 2 -5 

0 3 3 -6 -2 

1 1 -4 3 6 

14 

34 

-8 

9 

4 

L = 

1.0000 0 0 0 0 

-0.3333 1.0000 0 0 0 

4.0000 -12.4286 1.0000 0 0 

0 1.2857 -0.0698 1.0000 0 

0.3333 -0.5714 0.0129 -0.9815 1.0000 

U = 

x = 

3.0000 7.0000 -2.0000 -5.0000 4.0000 

0 2.3333 8.3333 -5.6667 4.3333 

0 0 110.5714 -48.4286 32.8571 

0 0 0 -2.0930 -5.2791 

0 0 0 0 1.5370 

1.0000 -1.0000 2.0000 -2.0000 3.0000 

ans = 

1.0000 

-1.0000 

2.0000 

-2.0000 

3.0000 

>> 

59

4.3.1 Costo computazionale 

Data una matrice A ∈ R n×n il costo della sua fattorizzazione LU è dato da 

n−1 

(n − i) + 2(n − i)(n − i) ≈ 2 

3 n3 

i=1 

Infatti ad ognuna delle n − 1 iterazioni, vengono eseguite n − i divisioni e 2 

operazioni per ognuno dei (n − i) 2 elementi. Svolgendo i calcoli, otteniamo: 

n−1 

n−1 

(n − i) + 2(n − i)(n − i) = 

i=1 

i=1 

n(n − 1) 

= n(n − 1) − 

2 

= n(n − 1) 

+ 

2 

2n(n − 1)(2n − 1) 

6 

n − i + 2n 2 − 4ni + 2i 2 

+ 2n 2 (n − 1) − 2n 2 (n − 1) + 

= 3n2 = 3n + (2n2 − 2)(2n − 1) 

6 

= 3n2 − 3n + 4n3 − 4n2 − 4n + 2 

≈ 

6 

4 

6 n3 = 2 

3 n3 

2n(n − 1)(2n − 1) 

6 

Per quanto riguarda l’occupazione di memoria, possiamo vedere che ad ogni 

iterazioni viene azzerata la parte della sottodiagonale principale. L’informazione 

riguardante il fattore U, ad ogni iterazione, viene scritta nella parte superiore 

della matrice, mentre l’informazione del fattore L, viene scritta nella nella parte 

inferiore. Siccome L è a diagonale unitaria, non richiede esplicita memorizzazione, 

rendendo così possibile scrivere sia il fattore L che il fattore U nella 

stessa matrice. In definitiva, per quanto riguarda l’occupazione di memoria, 

l’algoritmo di fattorizzazione LU ha un costo lineare. 

4.4 Matrici a diagonale dominante 

Vediamo in questa sezione una classe di matrici con determinate proprietà 

algebriche, che le rendono fattorizzabili LU. 

Definizione 8. A è diagonale dominante per righe se 

∀i = 1, . . .,n : |aii| > 

A è diagonale dominante per colonne se 

∀i = 1, . . .,n : |aii| > 

n 

j=1,j=i 

n 

j=1,j=i 

Lemma 1. A è diagonale dominante per righe se e solo se A è diagonale 

dominante per colonne. 

Lemma 2. A è diagonale dominante per righe (colonne) allora ∀i = 1, . . .,n, 

Ak è diagonale dominante per righe (colonne) 

60 

aij 

aji

Teorema 13. Se A è diagonale dominante allora A è non singolare. dim. (per 

assurdo) Supponiamo che A sia singolare; allora esiste x = 0 tale che Ax = 0. 

Supponiamo che xk sia la componente di massimo modulo e che sia uguale ad 

1. 

xk = max|xi| = 1 (4.19) 

Abbiamo quindi che | xi 

| ≤ 1. La k-esima equazione 

xk 

Quindi per la 4.19 

Allora 

akk = akkxk = − 

Ovvero 

n 

j=1,j=k 

n 

akjxj = 0 

j=1 

akkxk = akk 

akjxj ⇒ |akk| = | 

|akk| < 

n 

n 

akjxj| ≤ |akj xj 

 

j=1,j=k j=1,j=k 

xj 0(positività) 

⎛ 

1 

⎜ 

A = ⎜2 

⎝3 

2 3 

5 6 

6 8 

⎞ 

4 

7 ⎟ 

9⎠ 

4 7 9 0 

La precedente matrice è simmetrica ma non positiva. Infatti x = e4 = 0 mentre 

e T 4 Ae4 = 0 

Teorema 15. Se A è sdp, allora per ogni i = 1, . . .,n, aii > 0 

61 

| < 

n 

j=1,j=k 

akj

Teorema 16. Se A è sdp, allora per ogni i = 1, . . .,n, Ak è sdp. dim. Sia 

y ∈ Rk , y = 0, tale che yT Aky > 0. Sia x ∈ Rn tale che 

 

y 

x = = 0 

0 

Abbiamo che: 

0 < x T Ax = y T 0 T Ak B T 

B D 

y 

0 

 

= y T Ak y T B T y 

0 

Teorema 17. Se A è sdp, allora A è non singolare. dim.(per assurdo) Se A 

è singolare allora esiste x = 0 tale che Ax = 0. Per la proprietà di positività 

x T Ax > 0. Se sostituiamo Ax = 0 nella precedente espressione otteniamo 

l’assurdo: x T 0 > 0. 

Teorema 18. A è sdp allora A = LU La dimostrazione discende direttamente 

dai due teoremi precedenti 16 e 17 

Teorema 19. A è sdp se e solo se A = LDL T con 

. L triangolare inferiore a diagonale unitaria 

. D diagonale con elementi diagonali positivi 

dim.: Se A è sdp allora A = LDLT . Per il teorema 18 se A è sdp allora è 

LU. Prendiamo la matrice U uguale a DÛ, con 

⎛ 

u11 

⎜ 

D = ⎝ 

. .. 

⎞ 

0 

⎟ 

⎠ 

0 u1n 

Quindi 

Û = D −1 ⎛ 

1 

⎜ 

U = ⎝ 

. .. 

⎞ 

∗ 

⎟ 

⎠ 

0 1 

A = LU = L(DÛ ) 

 

U 

Siccome A = A T allora A T = (LD Û)T = ÛT DL T . Essendo la fattorizzazione 

LU unica segue che 

L = ÛT 

Û = L T 

Adesso rimane solo da dimostrare che gli elementi diagonali di D sono positivi. 

Risulta che: 

∀x = 0 : x T Ax > 0 

Definisco 

L T x = ei dove x = 0 

0 < x T Ax = x T LDL T x = (L T x) T D(L T x) = e T i Dei = di 

62 

 

= y T Aky > 0

dim.: Se A = LDL T allora A è sdp. Se A = LDL T allora 

A T = (LDL T ) T = (L T ) T D T L T = LDL T = A(simmetria) 

Ora rimane da dimostrare che ∀x = 0, xTLDLT x > 0. Ponendo LTx = y si ha 

che: 

y T n 

Dy = diiy 2 i > 0 

Vediamo adesso come si ottiene la fattorizzazione A = LDLT : 

⎛ 

1 

⎜ 

⎜l21 

L = ⎜ 

⎝ . 

. .. 

. .. . .. 

⎞ 

⎟ j = 1, . . . , n 

⎠ 

⎛ 

d1 

⎜ 

D = ⎝ 

. .. 

ln1 . . . ln,n−1 1 

Quando i = j 

Quindi 

Quando i > j 

Quindi 

i=1 

aij = e T i Aej = e T i (LDL T )ej = (e T i L)D(e T j L) T = 

j−1 

= 

k=1 

 

j 

k=1 

j−1 

likljkdk + lijljjdj = likljkdk + lijdj 

j−1 

aij = 

k=1 

k=1 

 

l 2 jkdk + lijljjdj = l 2 jjdj j−1 

+ 

k=1 

k=1 

ljkdk 

dn 

likljkdk 

⎞ 

⎟ 

⎠ 

j−1 

dj = ajj − ljk(ljkdk) j = 1, . . . , n (4.20) 

aij = 

j 

k=1 

lij = aij − 

likljkdk = lijljjdj 

 

j−1 

lik(ljkdk) 

k=1 

dj 

j−1 

k=1 

likljkdk 

i = j + 1, . . .,n (4.21) 

Possiamo vedere come nell’equazioni 4.20 e 4.21 sia presente il fattore 

likljk. Utilizzeremo un vettore d’appoggio per calcolarlo, così da calcolarlo 

una sola volta e risparmiare un pò di operazioni. 

Il costo computazionale della fattorizzazione LDL T è approssimativamente di 

1 

3 n3 flop. Per quanto riguarda l’occupazione di memoria, questo algoritmo, come 

d’altronde il metodo LU, non richiede addizionale spazio per la memorizzazione, 

tranne per il vettore di appoggio. I fattori L e D dell’avvenuta fattorizzazione 

possono essere tranquillamente scritti nella matrice A di partenza. 

63

Algoritmo 4.6 (Fattorizzazione LDL T ). 

function A=LDLT(A) 

% 


if m==n 

if A(1,1)

Per come è definito a (i) 

 

 

kii = maxk≥i a (i) 

 

 

ki , è il massimo della colonna i-esima 

sotto la componente ai−1,i; se il massimo in valore assoluto è zero, significa che 

tutti i numeri considerati sono zero, e pertanto A (i−1) : 

⎛ 

⎞ 

A (i−1) ⎜ 

= ⎜ 

⎝ 

a (1) 

11 a (1) 

12 . . . a (1) 

1i−1 

0 a (2) 

22 . . . a (2) 

2i−1 

. 

. 

. .. 

. 

a (1) 

1i 

a (2) 

2i 

. 

a (1) 

1i+1 . . . a (1) 

1n 

a (2) 

2i+1 . . . a (2) 

2n 

0 0 . . . a (i−1) 

i−1i−1 a (i−1) 

i−1i a (i−1) 

i−1i+1 . . . a (i−1) 

i−1n 

0 0 . . . 0 0 a (i−1) 

ii+1 

. 

. 

. 

0 0 . . . 0 0 a (i−1) 

ni+1 

. 

. 

. 

. 

. . . a (i−1) 

in 

. 

. . . a (i−1) 

nn 

I vettori che costituiscono le prime i − 1 colonne sono linearmente indipendenti 

e pertanto la i-esima colonna si può esprimere come combinazione lineare di 

queste. Pertanto si evince che la matrice A (i−1) è singolare. Inoltre ricordando 

che: 

A (i−1) = Li−2Li−3 . . .L1A 

si ha che: 

e quindi A è singolare. 

0 = det(A (i−1) ) = det(Li−2Li−3 . . . L1A) = det(A) 

A partire dalla matrice identità di ordine n, ovvero In, definiamo la prima 

matrice elementare di permutazione 

⎛ 

0 . . . . . . 0 1 0 

⎞ 

. . . 0 

⎜ . 

⎜ 

. 1 

⎜ 

. 

⎜ . .. 

⎜ 

P1 ≡ ⎜ 0 1 

⎜ 1 0 . . . . . . 

⎜ 0 . . . . . . . . . 

⎜ 

⎝ 

. 

. 

0 

. 

. . 

. 0 

0 

0 1 

. 

. 

. ⎟ 

. ⎟ ⎛ 

. ⎟ 0 

⎟ ⎜ 

. . . 0 ⎟ = ⎜ 0 

⎝ 

⎟ 1 

⎟ 

. ⎟ 

.. ⎠ 

0 

Ik1−2 

0 

1 

0 

0 

⎞ 

⎟ 

⎠ 

In−k1 

0 . . . . . . . . . 0 1 

(4.24) 

La suddetta matrice, non è altro che la matrice identità con la prima e la k-esima 

riga (colonna) scambiate tra di loro. È da notare che la matrice P è ortogonale 

e simmetrica, quindi risulta che P1 = P T 1 = P −1 

1 . 

Se moltiplichiamo la matrice A per la matrice P il risultato è la matrice A 

con due righe invertite. 

65 

⎟ 

⎠

⎛ 

P1A (1) ⎜ 

= ⎜ 

⎝ 

a (1) 

k11 . . . . . . . . . . . . . . . . . . a (1) 

k1n 

a (1) 

21 . . . . . . . . . . . . . . . . . . a (1) 

2n 

. 

a (1) 

k1−1,1 . . . . . . . . . . . . . . . . . . a (1) 

k1−1,n 

a (1) 

k11 . . . . . . . . . . . . . . . . . . a (1) 

k1n 

a (1) 

k1+1,1 . . . . . . . . . . . . . . . . . . a (1) 

k1+1,n 

. 

a (1) 

n1 . . . . . . . . . . . . . . . . . . a (1) 

nn 

. 

. 

⎞ 

⎟ 

⎠ 

←− riga 1 

←− riga k1 

(4.25) 

La matrice così ottenuta ha l’elemento ak11 diverso da zero, in quanto è di 

modulo massimo. Allora possiamo applicare il primo passo di eliminazione di 

Gauss, costruendo il primo vettore elementare di Gauss: 

g1 = 1 

ak11 

(0, a (1) 

21 

k1 

 

, . . . , 

a (1) 

11 

, . . . , a(1) 

n1 )T 

A questo punto, continuando come con il metodo LU, calcoliamo la prima 

matrice elementare di Gauss: 

L1 = I − g1e T 1 

con la quale possiamo calcolare 

⎛ 

a 

⎜ 

L1P1A1 = ⎜ 

⎝ 

(1) 

0 a (2) 

. . 

k11 . . . . . . a (1) 

k1n 

22 . . . a (1) 

2n 

0 a (2) 

n2 . . . a (2) 

nn 

. 

⎞ 

⎟ 

⎠ 

≡ A(2) 

(4.26) 

La procedura è analoga alla fattorizzazione LU; differisce solo nella moltiplicazione 

per la matrice P. In generale al passo i-esimo potremmo ottenere 

⎛ 

a 

⎜ 

Li−1Pi−1 . . . L1P1A1 = ⎜ 

⎝ 

(1) 

. 

0 .. 

. 

. 0 a (i) 

. . . 

. . . 

k11 . . . . . . . . . . . . a (1) 

k1n 

. .. (i−1) 

a ki−1,i−1 . . . . . . a (i−1) 

ki−1,n 

. 

. 

ii . . . a (i) 

in 

0 . . . 0 a (i) 

ni . . . a (i) 

nn 

Definendo l’i-esimo elemento di modulo massimo 

. 

. 

⎞ 

⎟ ≡ A 

⎟ 

⎠ 

(i) 

(4.27) 

|a (i) 

kii | ≡ max 

k≥i |a(i) 

ki | con ki > i (4.28) 

66

otteniamo la i-esima matrice di permutazione 

⎛ 

pi ≡ 

⎜ 

⎝ 

Ii−1 

0 0 1 

0 Iki−i−1 0 

1 0 0 

In−ki 

⎞ 

⎟ 

⎠ 

(4.29) 

L’elemento in posizione (i, i) della matrice PiA (i) sarà diverso da zero, in 

quanto è l’elemento di modulo massimo della i-esima colonna della matrice A. 

Possiamo definire a questo punto l’i-esimo vettore di gauss 

gi ≡ 1 

a (i) 

(0. . . .,0, 

a 

 

kii 

i 

(i) 

i+1,i 

ki 

 

, . . . , 

a (i) 

ii 

, . . . , a(i) 

ni )T 

con il quale otteniamo la i-esima matrice elementare di Gauss 

Li = I − gie T i 

Quindi con le matrici 4.27 , 4.29 e 4.31, otteniamo 

LiPiA (i) ⎛ 

a 

⎜ 

= ⎜ 

⎝ 

(1) 

0 

. 

. 

. .. 

0 a 

. 

(i+1) 

. 

. 

. 

. 

. 

. 

. 

. 

k11 . . . . . . . . . . . . a (1) 

k1n 

. .. a (i) 

kii . . . . . . a (i) 

kin 

i+1,i+1 . . . a (i+1) 

i+1,n 

0 . . . 0 a (i+1) 

n,i+1 . . . a (i+1) 

n,n 

⎞ 

⎟ ≡ A 

⎟ 

⎠ 

(i+1) 

(4.30) 

(4.31) 

(4.32) 

Per il teorema 20, sappiamo che se A è non singolare, sarà sempre possibile 

scegliere l’elemento di modulo massimo diverso da zero, e quindi continuare 

l’algoritmo fino all’iterazione i = n − 1, ottenendo la fattorizzazione 

Ln−1Pn−1Ln−2Pn−2 . . . L1P1A = A (n) ≡ U 

Se PA = LU, allora L −1 PA = U. Cerchiamo di scoprire chi è il fattore L −1 ; 

Consideriamo la seguente equazione: 

Con 

ˆLn−1 ≡ Ln−1 

ˆLn−1 ˆ Ln−2 . . . ˆ L1PA = U 

ˆLi ≡ Pn−1 . . . Pi+1LiPi+1 . . .Pn−1 per i = 1, . . .,n − 2 

P ≡ Pn−1 . . . P1 (4.33) 

Di conseguenza la matrice 

ˆLn−1 . . . ˆ L1 ≡ L −1 

67

Infatti ˆ Li è una matrice triangolare inferiore a diagonale unitaria. Osserviamo 

che 

ˆLi = (Pn−1 . . . Pi+1)(I − gie T i )(Pi+1 . . . Pn−1) = 

= I − (Pn−1 . . .Pi+1gi)(e T i Pi+1 . . . Pn−1 

 

eT i Pj=eT i ∀j>i 

) = I − (Pn−1 . . . Pi+1gi 

 

dove ˆgi non è altro che l’i-esimo vetore elementare di Gauss con le prime i 

componenti permutate. Ne deduciamo che la struttra di ˆ Ln−1 . . . ˆ L1 è uguale a 

quella di una matrice triangolare inferiore a diagonale unitaria. 

Esempio 20. Facciamo un esempio teorico con n = 4. Applicando l’algoritmo 

fin qui descritto otterremo 

L3P3L2P2L1P1 ≡ A (4) 

Sostituendo le matrici Li con le corrispondenti ˆ Li otteniamo 

L3P3L2 P3P3 P2L1 P2 P3P3 

 

I 

I 

 

P2 P1 = A 

 

I 

(4) 

Notiamo che le sostituzioni non alterano la struttura della matrice. 

L3 (P3L2P3) (P3P2L1P2P3) 

 

ˆL2 

ˆL1 

68 

(P3P2P1) 

 

P=P −1 =P T 

ˆgi 

)e T i

Algoritmo 4.7 (Fattorizzazione PLU). 

function [A,P]=PLU(A) 

%Fattorizza la matrice in tre fattori 

%INPUT 

% A è una matrice non singolare 

%OUTPUT 

% A contiene i fattori L e U 

% P è la matrice di permutazione 

P=[1:n]; 

for i=1:n-1 

[mi,ki]=max(abs(A(i:n,i))); 

if mi==0 

error(’La matrice è singolare’) 

end 

ki=ki+i-1; 

if ki>i 

A([i ki],:)=A([ki i],:); 

P([i ki])=P([ki i]); 

end 

A(i+1:n,i)=A(i+1:n,i)/A(i,i); 

A(i+1:n,i+1:n)=A(i+1:n,i+1:n)-A(i+1:n,i)*A(i,i+1:n); 

end 

4.7 Condizionamento del problema 

Accenniamo questo argomento per introdurre meglio un altro tipo di fattorizzazione. 

Più in dettaglio vogliamo capire come degli errori sui dati in ingresso si 

possono ripercuotere sui dati in uscita. In un sistema lineare Ax = b, andremo 

a introdurre al posto di A e di b rispettivamente (A + ∆A) e (b + ∆b). Il nostro 

sistema risulterà quindi perturbato. 

(A + ∆A)(x + ∆x) = (b + ∆b) (4.34) 

Poniamo ∆A = ǫ · F con F ∈ R n×n e ∆b = ǫ · f con f ∈ R n . Definiamo 

allora 

A(ǫ) = A + ǫF = A + ∆A =⇒ A(0) = A (4.35) 

b(ǫ) = b + ǫf = b + ∆b =⇒ b(0) = b (4.36) 

Possiamo quindi scrivere l’equazione funzionale ad ǫ. 

A(ǫ)x(ǫ) = b(ǫ) (4.37) 

69

Siamo interessati a sviluppare x(ǫ) per arrrivare poi all’equazione del condizionamento 

di un sistema lineare. Quindi sviluppando con Taylor otteniamo: 

x(ǫ) = x(0) + ǫ ˙x(0) + o(ǫ 2 ) ≈ x(0) + ǫ ˙x(0) 

Siccome x(0) = x e x(ǫ) = x + ∆x, otteniamo che 

∆x = (x+∆x)−x = (x+∆x)−x(0) = x(ǫ)−x(0) ≈ x(0)+ǫ ˙x(0)−x(0) = ǫ ˙x(0) 

Abbiamo quindi ricavato l’errore assoluto. Continuando nel nostro percorso 

per la scoperta del condizionamento di un sistema lineare proviamo a derivare 

membro a membro l’equazione 4.37 

d 

A(ǫ)x(ǫ) 

dǫ 

= 

d 

dǫ b(ǫ) 

d 

A(ǫ)x(ǫ) 

dǫ 

= f 

A(ǫ)x(ǫ) ˙ + A(ǫ) ˙x(ǫ) = f 

Fx(ǫ) + A(ǫ) ˙x(ǫ) = f 

Calcolando quest’ultima equazione nel punto ǫ = 0 otteniamo che 

Ovvero 

Fx + A ˙x(0) = f 

˙x(0) = A −1 (f − Fx) 

Moltiplicando ambo i membri per ǫ riusciamo a riottenere un espressione in 

funzione dell’errore assoluto 

ǫ ˙x(0) = A −1 (ǫf − ǫFx) 

∆x = A −1 (∆b − ∆Ax) 

Considerando il risultato ottenuto con le norme otteniamo che 

||∆x|| = ||A −1 · (∆b − ∆Ax)|| ≥ ||A −1 || · ||(∆b − ∆Ax)|| ≥ ||A −1 || · (||∆b|| + ||∆A|| · ||x||) 

Dividendo membro a membro per ||x|| 

||∆x|| 

||x|| ≤ ||A−1 

||∆b|| 

|| 

||x|| 

Moltiplicando e dividendo per ||A|| 

||A −1 

||∆b|| ||∆A|| 

|| · ||A|| + 

||x|| ||A|| ||A|| 

 

+ ||∆A|| 

≤ ||A −1 

||∆b|| ||∆A|| 

|| · ||A|| + 

||b|| ||A|| 

Abbiamo ricavato l’errore sui dati in uscita, il coefficiente k di condizionamento, 

in funzione dei dati in ingresso 

||∆x|| 

||x|| ≥ ||A−1 

||∆b|| ||∆A|| 

|| · ||A|| + (4.38) 

||b|| ||A|| 

70

Dove 

||∆x|| 

||x|| 

è l’errore in uscita (4.39) 

||A −1 || · ||A|| è il coefficiente di condizionamento (4.40) 

||∆b|| 

||b|| 

+ ||∆A|| 

||A|| 

chiamato anche k 

Definiamo allora la funzione di condizionamento 

Ovvero 

è l’errore sui dati in ingresso (4.41) 

k(x) : R n×n −→ R 

k(A) ≡ ||A|| · ||A −1 || (4.42) 

Notiamo che il numero di condizionamento k(A) non può mai essere inferiore 

ad uno. Infatti abbiamo che 

k(A) = ||A|| · ||A −1 || ≥ ||A · A −1 || = ||I|| = 1 

Quindi il numero di condizionamento di una matrice deve essere raffrontato 

all’unità. 

Esempio 21 (Condizionamento di una matrice). Con questo esempio si vuole 

far vedere che esistono alcune matrici che hanno un numero di condizionamento 

talmente alto, da non permetterci di fare alcuna operazione direttamente. 

Consideriamo quindi la seguente matrice 

⎛ 

⎞ 

1 

⎜ 

. 

A = ⎜100 

.. 

⎟ 

⎜ 

⎝ 

. .. . ⎟ 

.. ⎠ 

100 1 

10×10 

È una matrice con la diagonale principale formata da dieci 1, mentre la sottodiagonale 

principale ha nove 100. In matlab si è possibile costruire la matrice 

sopracitata con i seguenti comandi. 

> diag0=ones(10,1); 

>> diag_1=100*ones(9,1); 

>> A=zeros(10,10)+diag(diag0,0)+diag(diag_1,-1); 

Poi calcoliamo la norma della matrice e della sua inversa. 

>> normA=norm(A,1) 

normA = 

101 

>> normInvA=norm(inv(A),1) 

Warning: Matrix is close to singular or badly scaled. 

71

normInvA = 

1.0101e+018 

Results may be inaccurate. RCOND = 9.801980e-021. 

Infine calcoliamo il numero di condizionamento 

>> normA*normInvA 

ans = 

1.0202e+020 

Sicuramente un numero di condizionamento troppo alto. Un errore sui dati in 

ingresso dell’ordine di 10 −10 , comporterebbe un errore sui dati in uscita di 10 10 . 

Sicuramente non è accettabile. 

4.8 Sistemi lineari sovradimensionati 

In questa sezione proporremo un metodo per cercare di risolvere sistemi Ax = b, 

in cui A è una matrice rettangolare (m×n) con m ≫ n e tale che A sia di rango 

massimo, ovvero n = rank(A) = dim(ran(A)). Sia 

A ∈ R m×n 

con A = (c1, c2, . . . cn), cj ∈ R m 

Sappiamo che il range di A è definito come 

⎧ 

⎨ 

ran(A) = 

⎩ y ∈ Rm : y = 

Il rango di una matrice invece è definito come 

Tenendo conto che 

Abbiamo che 

⎧ 

⎪⎨ 

dim(null(A)) = n − rank(A) = 

⎪⎩ 

k 

n 

j=1 

rank(A) = dim(ran(A)) 

αjcj 

null(A) = {x ∈ R n : Ax = 0} 

⎫ 

⎬ 

⎭ 

0 se rank(A) = n 

se e solo se null(A) = 0 

> 0 esistono infiniti vettori in null(A) 

Consideriamo il primo caso, ovvero il caso in cui dim(null(A)) = 0, cioè quando 

la matrice A ha rango massimo. Il problema che dobbiamo affrontare con 

i sistemi lineari sovradimensionati, non è tanto l’unicità della soluzione, ma 

l’esistenza. Infatti 

Sia b ∈ R m ran(A) ⊂ R m 

Il range di A ha dimensione n che è minore di m.Il fatto che b appartenga 

al range di A è da scartare perchè probabilisticamente impossibile. Non ci 

possiamo quindi aspettare una soluzione classica Ax = b. 

72

Definizione 10 (Soluzione del sistema lineare sovradimensionato). Sia r = 

Ax − b il vettore residuo. La soluzione x è il vettore che minimizza la seguente 

quantità: 

||r|| 2 

2 = 

m 

i=1 

|ri| 2 = ||Ax − b|| 2 

2 

Tale soluzione viene definita anche come soluzione ai minimi quadrati. 

Teorema 21 (Fattorizzazione QR). Sia A ∈ R m×n con m > n tale che 

rank(A) = n. Allora esistono 

• Q ∈ R m×n , con Q T Q = Im 

• ˆ R ∈ R n×n triangolare superiore e non singolare 

tali che 

 

ˆR 

A = QR = Q 

0 

ˆR ∈ R m×n 

(4.43) 

È interessante notare che Q sia ortogonale. Consideriamo la norma euclidea 

del prodotto Qv, dove v è un vettore. 

||Qv|| 2 

 

I 

2 = (Qv)T QV = v T Q T Q 

V = v T v = ||v|| 2 

2 

Cerchiamo quindi di minimizzare la quantità della definizione 10. 

||Ax − b|| 2 

2 = ||QRx − b||2 2 = ||Q(Rx − QTb)|| 2 

2 = ||Rx − g||2 2 

dove g = Q T b. Sviluppiamo formalmente l’espressione Rx − g 

||Rx − g|| 2 

2 = 

 

 

 

ˆR 

 

 

x − 

0 

g1 

g2 

 

 

 

2 

2 

dove g1 ∈ R n , g2 ∈ R m−n×n 

 

2 

ˆRx 

= 

− g1 

 

 

 

−g2 

= 

2 

ˆ 

 

Rx − g1 

2 

2 

+ ||g2|| 2 

2 

 

 

Quello che possiamo fare è minimizzare la quantità 

ˆ 

 

Rx − g1 

2 

. Quindi 

Se Rx ˆ = g1 allora ||Ax − b|| 2 2 

2 = ||g2|| 2 ≡ min 

4.9 Esistenza della fattorizzazione QR 

Al fine di determininare l’esistenza della fattorizzazione QR, dobbiamo conoscere 

qualche particolare. Supponiamo di avere 

• un vettore z ∈ R n 

• una matrice H ∈ R n×n ortogonale, ovvero tale che H T H = I 

73 

2

tali che 

⎛ ⎞ 

α 

⎜ 

⎜0 

⎟ 

Hz = αe1 = ⎜ . ⎟ 

⎝ . ⎠ 

0 

(4.44) 

La matrice H è chiamata matrice di HouseHolder. Consideriamo la norma 

euclidea dei due membri dell’equazione 4.44 

Queste due equazioni implicano che 

||Hz|| 2 

2 = zT H T Hz = z t z = ||z|| 2 

2 

||αe1|| 2 

2 = |α|2 · ||e1|| 2 

2 = |α|2 

α = ± ||z|| 2 

Definiamo la matrice H nel seguente modo: 

H = I − 2 

v T v vvT 

Verifichiamo che H è ortogonale ovvero che HH T = I: 

H T H = H 2 

= I − 2 

vT v vvT 

 

I − 2 

vT v vvT 

 

(4.45) 

con v ∈ R n v = 0 (4.46) 

= I− 4 

v T v vvT + 4 

(v T v) 2 v(vT v)v T = I 

Affinché la matrice di Householder sia consistente con l’equazione 4.44, dobbiamo 

scegliere il vettore v in modo particolare. Scegliamo allora 

v = z − αe1 

Dimostriamo che l’equazione appena scritta soddisfa la 4.44. 

Hz = 

 

I − 2 

vT v vvT 

 

z = z− 2 

vTv vvT z = z− 2 

vTv (zT z−αz1)v = 

(4.47) 

= z− 2 

vT v (zT 

z−αz1)(z−αe1) = 1 − 2 

vT v (zT 

z − αz1) z+α 2 

vT v (zT z−αz1)e1 

Se la quantità 

2 

vT v (zT z − αz1) (4.48) 

è uguale a uno, allora il primo addendo si annulla e il secondo addendo è uguale 

a αe1. Dimostriamo allora che l’espressione 4.48 è uguale a uno. 

Se 

2 

v T v (zT z −αz1) = 1 allora 2z T z −2αz1 = v T v = (z −αe1) T (z −αe1) = 

= z T z+α 2 −2α e T 1 z 

 

z1 

= 2z T z−2αz1 

74 

Nota: 

v T z = (z − αe1) T z = 

= z T z − αe T 1 z 

Nota: 

α = ||z|| 2 

Quindi 

α 2 = ||z|| 2 

2 = zT z

Guardiamo in dettaglio il vettore v: 

Se 

⎛ ⎞ 

z1 

⎜z2⎟ 

⎜ ⎟ 

z = ⎜ ⎟ 

⎝ . ⎠ allora v = z − αe1 

⎛ ⎞ 

z1 − α 

⎜ z2 ⎟ 

⎜ ⎟ 

= ⎜ ⎟ 

⎝ . ⎠ 

zn 

Se in aritmetica esatta le operazioni di addizione e sottrazione sono esatte, in 

aritmetica finita non è così. Siccome per l’equazione 4.45, è possibile scegliere 

il segno di α, lo sceglieremo in modo da rendere ben condizionata la somma 

algebrica. Quindi 

α = −sign(z1) · ||z|| 2 dove sign(z1) = 

zn 

1 se z1 ≥ 0 

−1 se z1 < 0 

Inoltre se z è non banale, abbiamo che |v1| = 0. Allora posso riscrivere il vettore 

v in questo modo: 

⎛ ⎞ 

1 

v2 ⎜ ⎟ 

⎜ v1 ⎟ 

v = v1 · ⎜ ⎟ 

⎝ ⎠ = v1 · ˆv 

Abbiamo ottenuto ˆv in funzione di v. 

. 

vn 

v1 

ˆv = 1 

v 

Vediamo adesso la matrice di householder in funzione del vettore ˆv 

v1 

H = I − 2 

ˆv t ˆv ˆvˆvT = I − 2 

v T v 

v 2 1 

1 

v 2 1 

vv T = I − 2 

v T v vvT 

Come si può notare, la matrice espressa con v oppure ˆv rimane la stessa. Questa 

proprietà di invarianza risulterà utile per rendere più efficiente l’algoritmo per 

la risoluzione di sistemi lineari con metodo di fattorizzazione QR. Dimostriamo 

come avviene la fattorizzazione in modo iterativo della matrice A di partenza 

nelle matrici Q ed R. Sia A la seguente matrice: 

⎛ 

a 

⎜ 

A = ⎜ 

(0) 

11 . . . . . . a (0) 

⎞ 

1n 

⎟ 

. 

. ⎟ ≡ A (0) 

(4.49) 

⎜ 

⎝ 

. 

. 

. 

. 

. 

. 

a (0) 

m1 . . . . . . a (0) 

mn 

con le notazioni usate solitamente. Definiamo la matrice elementare di Householder 

H1 ∈ Rm×m , tale che 

H (1) 

⎛ 

a 

⎜ 

⎝ 

(0) 

11 

. 

. 

a (0) 

⎞ 

⎟ 

⎠ 

m1 

≡ 

⎛ 

a 

⎜ 

⎝ 

(1) ⎞ 

11 

0 ⎟ 

(4.50) 

. ⎠ 

0 

75 

⎟ 

⎠

Questo v1, il vettore Householder andrà associato alla prima colonna della 

matrice A. Moltiplicandolo avremo 

H1A (0) ⎛ 

a 

⎜ 

= ⎜ 

⎝ 

(1) 

11 a (1) 

12 . . . a (1) 

1n 

0 a (1) 

22 . . . a (1) 

⎞ 

⎟ 

2n ⎟ 

. 

. 

. ⎟ ≡ A(1) (4.51) 

. ⎠ 

0 a (1) 

m2 . . . a (1) 

mn 

Il secondo passo inizia considerando la porzione della seconda colonna e definisce 

la seconda matrice di Householder 

H (2) 

⎛ 

a 

⎜ 

⎝ 

(1) 

22 

. 

a (1) 

⎞ 

⎟ 

⎠ 

m2 

≡ 

⎛ 

a 

⎜ 

⎝ 

(2) ⎞ 

22 

0 ⎟ 

⎟. 

(4.52) 

. ⎠ 

0 

quindi considerando A2 come 

⎛ 

A (1) ⎜ 

= ⎜ 

⎝ 

con A1 non singolare. Definendo H2 come 

 

1 

H2 = 

a (1) 

11 a (1) 

12 . . . a (1) 

0 

1n 

. 

. 

0 

A1 

H (2) 

 

∈ R m×m 

⎞ 

⎟ 

⎠ 

(4.53) 

(4.54) 

possiamo premoltiplicarla per A (1) ed eseguire il nostro passo di fattorizzazione. 

H2A (1) ⎛ 

a 

⎜ 

= H2H1A = ⎜ 

⎝ 

(1) 

11 a (1) 

12 a (1) 

0 a (2) 

22 a (2) 

0 0 a (2) 

. 

. 

. 

13 . . . a (1) 

1n 

23 . . . a (2) 

2n 

33 . . . a (2) 

3n 

. 

0 0 a (2) 

m3 . . . a (2) 

mn 

⎞ 

⎟ ≡ A 

⎟ 

⎠ 

(2) 

Induttivamente possiamo definire la generica matrice al passo i-esimo 

A (i) ⎛ 

a 

⎜ 

≡ HiHi−1 . . .H1A = ⎜ 

⎝ 

(1) 

11 . . . . . . . . . . . . a (1) 

0 

. 

. .. 

. .. (i) 

a ii . . . 

1n 

. 

. . . a (i) 

. 

. 0 a 

1n 

(i) 

i+1,i+1 . . . a (i) 

. . . 

⎞ 

⎟ 

i+1,n ⎟ 

. ⎠ 

0 . . . 0 a (i) 

m,i+1 . . . a (i) 

mn 

76 

dove a (j) 

jj 

= 0, j = 1, . . . , i.

A questo punto l’i-esimo passo consiste nel costruire l’i-esima matrice di Householder 

H (i+1) 

⎛ 

a 

⎜ 

⎝ 

(i) 

i+1,i+1 

. 

a (i) 

⎞ 

⎟ 

⎠ 

m,1+1 

≡ 

⎛ 

a 

⎜ 

⎝ 

(i+1) ⎞ 

i+1,i+1 

0 ⎟ . 

. ⎠ 

0 

(4.55) 

al fine di definire la seguente matrice 

Hi+1 = 

Ii 

H (i+1) 

 

∈ R m×m 

Premoltiplicando la matrice Hi+1 per A (i) , otteniamo 

A (i) ⎛ 

a 

⎜ 

≡ HiHi−1 . . .H1A = ⎜ 

⎝ 

(1) 

. 

0 .. 

. . 

. .. (i+1) 

a 

. 0 a (i+1) 

. 

. 

. 

11 . . . . . . . . . . . . a (1) 

1n 

1+1;i+1 . . . . . . a (1+1) 

1+1,n 

i+2,i+2 . . . a (i+1) 

i+2,n 

0 . . . 0 a (i) 

m,i+1 . . . a (i) 

mn 

. 

. 

⎞ 

⎟ 

⎠ 

(4.56) 

Eseguendo i vari passi si finisce su sottomatrici sempre più piccole e non singolari 

e otterremo 

A (n) ⎛ 

a 

⎜ 

≡ Hn . . . H1A = ⎜ 

⎝ 

(1) 

11 . . . a (1) 

0 

. 

. 

. 

. 

. .. 

. .. 

⎞ 

in 

⎟ 

. ⎟ 

(n) 

a ⎟ 

nn ⎟ ≡ R 

0 

⎟ 

. ⎟ 

. 

⎠ 

0 . . . 0 

Infine ponendo Q T = Hn · · · H1 otterremo la 4.43. 

77 

dove a (i+1) 

i+1,i+1 = 0.

Algoritmo 4.8 (Fattorizzazione QR). 

function [A] = QR(A) 

% [A] = QR(A) 

% 

% Calcola e restituisce la fattorizzazione QR della matrice in input. 

% La matrice in uscita contiene i vettori di Householder normalizzati 

% secondo la prima componente uno per colonna nella parte strettamente 

% triangolare inferiore. Mentre nella parte triangolare superiore 

% contenuta la R^. 

% 

% 

% See also RISOLVI_QR 

[m,n] = size(A); 

if m>=n 

for i=1:n 

alpha = norm(A(i:m,i)); 

if alpha == 0 

error(’La matrice non ha rango massimo.’); 

end 

if A(i,i) >= 0 

alpha = -alpha; 

end 

v1 = A(i,i) - alpha; 

A(i,i) = alpha; 

A(i+1:m,i) = A(i+1:m,i)/v1; 

beta = -v1/alpha; 

A(i:m,i+1:n)=A(i:m,i+1:n)-(beta*[1;A(i+1:m,i)])*([1 A(i+1:m,i)’]*A(i:m,i+1:n)); 

end 

else 

error(’La matrice non fattorizzabile QR.’); 

end 

78

Capitolo 5 

Approssimazione di funzioni 

Una funzione f(x), può essere a volte anche molto complicata. In certe applicazioni, 

che richiedono una certa velocità di esecuzione, è preferibile utilizzare 

un’approssimazione di tale funzione, che sia molto più semplice e quindi più 

facile da calcolare. Inoltre non sempre si conosce direttamente la funzione, ma 

solo alcuni suoi punti. Vediamo che cos’è un approssimazione e come possiamo 

fare per calcolare la funzione approssimata. Chiameremo f(x) la funzione 

originaria, e p(x) il polinomio approssimato. 

5.1 Interpolazione polinomiale 

Sia f(x) f : [a, b] −→ R [a, b] ∈ R 

Consideriamo un ordine in [a, b] così fatto: 

a ≤ x0 < x1 < x2 < . . . < xn ≤ b 

Avremo quindi n+1 ascisse all’interno dell’intervallo [a, b].Per ogni i = 0, . . . , n 

conosciamo 

fi ≡ f(xi) (5.1) 

Quindi a partire da n + 1 coppie (xi, fi) il problema è quello di riuscire a 

determinare un polinomio p(x) tale che 

Sia 

p(xi) = fi i = 0, . . .,n (5.2) 

Πn = {p(x) : p è il polinomio di grado al più n} 

Teorema 22. Esiste ed è unico il polinomio interpolante pn ∈ Πn tale che 

dim. 

pn(xi) = fi i = 0, . . .,n 

pn ∈ Πn ⇐⇒ pn(x) = 

n 

k=0 

n 

akx k 

k=0 

akx k i = fi i = 0, . . .,n (5.3) 

79

La condizione di interpolazione si traduce nel seguente sistema lineare, nelle 

incognite a0, a1, . . . an: 

a0 + a1x0 + . . . anx n 0 

a0 + a1x1 + . . . anx n 1 

. . . 

a0 + a1xn + . . . anx n n 

Questo sistema di equazioni può essere rappresentato così: 

Dove 

⎛ 

ao 

an 

⎞ 

⎜a1⎟ 

⎜ ⎟ 

a = ⎜ . ⎟ 

⎝ . ⎠ 

⎛ 

f0 

fn 

⎞ 

⎜f1⎟ 

⎜ ⎟ 

f = ⎜ . ⎟ 

⎝ . ⎠ 

V a = f (5.4) 

⎛ 

⎜ 

V = ⎜ . 

⎝ . 

x0 0 x1 0 . . . xn 0 

x0 1 x1 1 . . . xn 1 

. 

. 

. .. 

. 

. 

x 0 n x1 n . . . x n n 

⎞ 

⎟ ∈ Rn+1×n+1 

⎠ 

V è la matrice di Van Der Monde traposta. Di tale matrice si conoscono alcune 

sue proprietà, ed in particolare sappiamo calcolare il suo determinante. Infatti 

det(V ) = 

(xi − xj) = 0 

i>j 

Il suo determinante è diverso da zero, quindi esiste ed è unica la soluzione del 

sistema 5.4, e quindi esiste ed è unico il polinomio interpolante. 

La matrice di Van Der Monde inoltre presenta un numero di condizionamento 

molto alto. 

Esempio 22. Supponiamo che nell’intervallo [0, 1) vi siano le ascisse così de- 

terminate : xi = 1 

n i = 1, . . .,n Mostriamo il numero di condizionamento 

della relativa matrice di Van Der Monde in funzione di n. 

n k 

1 15 

2 99 

. . 

20 1017 Come si evince da questo semplice esempio, risulta impraticabile trovare il 

polinomio interpolante la funzione f con il metodo sopra descritto. Dobbiamo 

quindi considerare metodi alternativi. 

5.2 Forma di Lagrange e forma di Newton 

In questa sezione prenderemo in considerazione una base differente per il calcolo 

del polinomio interpolante. Invece della canonica base 5.3, esaminiamo i 

polinomi nella forma di Lagrange. 

80

Risulta che: 

Lkn(x) = 

n 

x − xj 

xk − xj 

j=0,j=k 

Lkn(xi) = 

, k = 0, 1, . . .,n (5.5) 

1 i = k 

0 i = k 

Essi hanno grado esatto n e il loro coefficiente principale è : 

n 

j=0,j=n 

1 

(xk − xj) 

Infatti sviluppando il polinomio di Lagrange, otteniamo 

n 

x − xj 

xk − xj 

j=0,j=k 

= 

n 

j=0,j=n 

1 

(xk − xj) 

(5.6) 

, k = 0, 1, . . .,n (5.7) 

(x − x0) · . . . · (x − xk−1 (x − xk+1) · . . . · (x − xn) 

 

 

k 

n−k 

(5.8) 

Inoltre essendo i polinomi di Lagrange linearmente indipendenti tra di loro, 

costituiscono una base per Πn. 

Teorema 23 (Forma del polinomio di Lagrange). 

pn(x) = 

n 

fkLkn(x) (5.9) 

k=0 

Il polinomio 5.9 appartiene a Πn e soddisfa i criteri del polinomio interpolante 

definiti nell’equazione 5.2. 

dim. 

Per ogni i = 0, 1, . . .,n si ha che 

⎛ 

⎞ 

n 

n 

p(xi) = fkLkn(xi) = ⎝ fkLkn(xi) ⎠ + fiLin(xi) = fiLin(xi) = fi 

k=0 

k=0,k=i 

Infatti per la 5.6, la sommatoria 

n 

k=0,k=i 

i = k, mentre essendo i = k, Lin(xi) vale 1. 

fkLkn(xi), vale sempre zero perché 

Esempio 23. Come al solito un esempio ci può chiarire alcuni dubbi che 

avevamo. Prendiamo ad esempio il seguente polinomio: 

p(x) = − 1 

50 x5 + 1 

5 x4 − 1 

20 x3 + 3x 2 − 20x. (5.10) 

Calcoleremo i polinomi interpolanti dal primo grado, fino al quinto grado. Le 

coppie (xi, fi) con i = 2, 3, 4, 5, 6, sono state scelte in modo tale che i punti xi 

fossero equidistanti. Questo non inficia in alun modo la validità dell’esempio. 

Mostriamo quidi i codici matlab che ci sono serviti: 

81

Algoritmo 5.1 (Interpolazione con base di lagrange). 

function p=lagrange1(xi,fi) 

n=length(xi); 

L=1; 

p=0; 

for k=1:n 

L=1; 

for j=1:n 

if k~=j 

L=conv(L,[1,-xi(j)])/(xi(k)-xi(j)); 

end 

end 

L 

p=addVecR(p,(fi(k)*L)); 

end 

return; 

Riportiamo anche il codice della funzione addV ecR, che somma i vettori 

che rappresentano i polinomi, in modo consistente. Infatti in matlab si possono 

sommare solo polinomi di ugual grado con l’operatore +. 

Algoritmo 5.2 (Somma di polinomi). 

function x=addVecR(A,B) 

if length(A)>length(B) 

long=A; 

short=B; 

end 

if length(B)>length(A) 

long=B; 

short=A; 

end 

if length(B)== length(A) 

%non si fa niente perch si possono sommare tranquillamente 

x=A+B; 

else 

short=[zeros(1,length(long)-length(short)),short]; 

x=long+short; 

end 

82

Il seguente codice invece è quello che realizza il grafico 5.1. 

Algoritmo 5.3 (Esempio di interpolazione con base di Lagrange). 

function esempioLagrange(i,a,b) 

poly=[-1/50,1/5,-1/20,3,-20,0] 

x=[a:0.2:b]; 

y=polyval(poly,x); 

plot(x,y,’k’,’LineWidth’,2); 

hold on 

color=[’r’,’g’,’b’,’y’,’m’,’c’]; 

for k=1:i-2 

xi=[a:(b-a)/k:b]; 

fi=polyval(poly,xi); 

pol=lagrange1(xi,fi) 

y=polyval(pol,x); 

plot(x,y,color(k),’LineWidth’,1); 

end 

In particolare si creano i vari polinomi interpolanti di grado n = 1, 2, . . ., 4. 

Per farlo dobbiamo prima prima creare le coppie di valori (xi, fi). Queste potrebbero 

essere un dato già conosciuto, ma nel nostro caso le ricaviamo dal polinomio. 

I valori xi vengono ricavati semplicemente dividendo l’intervallo [a, b] 

in k + 1 parti, per ottenere k + 2 ascisse. Le corrispondenti yi invece vengono 

ricavate valutando il polinomio per ogni elemento in xi. Questi due vettori rappresentano 

i punti che vanno in input alla funzione 5.1, che una volta eseguita 

ritorna il polinomio interpolante. A questo punto per disegnare il polinomio 

interpolante, basta valutarlo sulle ascisse x, proprio come abbiamo fatto per il 

polinomio di partenza. N.B. sappiamo che il polinomio interpolante esiste ed è 

unico. Siccome è unico se provassimo a interpolare un polinomio di grado n con 

un altro di pari grado oppure maggiore, otterremo lo stesso identico polinomio! 

Nella figura 5.1 possiamo notare i vari polinomi. Distinguendoli per colore 

troviamo: 

rosso è il polinomio interpolante di grado 1.I suoi punti di interpolazione sono: 

xi 0 10 

fi 0 −723.84 

Il polinomio interpolante è: p(x) = −60.32x 

verde è il polinomio interpolante di grado 2.I suoi punti di interpolazione sono: 

xi 0 6 12 

fi 0 80.88 −723.84 

Il polinomio interpolante è: p(x) = −12.3x 2 + 87.28x 

83

lu è il polinomio interpolante di grado 3.I suoi punti di interpolazione sono: 

xi 0 4 8 12 

fi 0 −4.48 170.24 −723.84 

Il polinomio interpolante è: p(x) = −3.25x 3 + 44.6x 2 − 127.52x 

giallo è il polinomio interpolante di grado 4.I suoi punti di interpolazione sono: 

xi 0 3 6 9 12 

fi 0 −23.01 80.88 157.77 −723.84 

Il polinomio interpolante è: p(x) = −0.4x 4 − 6.25x 3 − 24x 2 − 18.8x 

200 

100 

0 

−100 

−200 

−300 

−400 

−500 

−600 

−700 

−0.02 x 5 + 0.2x 4 −0.05x 3 +3x 2 −20x 

−60.32x 

−12.3x 2 +87.28x 

−3.25x 3 +44.6x 2 −127.52x 

−0.4x 4 +6.25x 3 −24x 2 +18.88x 

−800 

0 2 4 6 8 10 12 

Figura 5.1: Grafico dei polinomi interpolanti la funzione 5.10 

Con la forma di Lagrange, se volessimo aggiungere un ascissa di interpolazione, 

dovremmo rieseguire di nuovo l’algoritmo con i nuovi punti (xi, fi), 

ricostruendo tutte le informazioni necessarie. La forma di Newton, risolve questo 

problema, rendendo possibile una costruzione incrementale del polinomio, 

cioè a partire dal polinomio di grado n, pn(x), possiamo ottenere pn+1(x). Per 

farlo prendiamo in considerazione una diversa base per rappresentare i polinomi. 

Definizione 11 (Base di Newton). 

Quindi: 

ω0(x) ≡ 1 (5.11) 

ωk+1 ≡ (x − xk) · ωk(x) k = 0, 1, . . . (5.12) 

ωk+1 = 

k 

(x − xj) (5.13) 

j=0 

I polinomi di newton godono delle seguenti proprietà: 

• ωk(x) ∈ Π ′ k dove Π ′ k 

rappresentano i polinomi monici di grado k. 

84

dim. Possiamo dimostrare questa proprietà per induzione sul grado del 

polinomio. La base dell’induzione risulta vera; infatti ω0(x) = 1 per definizione 

risulta appartenere a Π ′ 0. Per ipotesi induttiva, ωk ∈ Π ′ k . Dalla 

definizione 5.12, ωk+1 = (x − xj) · ωk(x).Moltiplicando un polinomio di 

grado 1 con un altro di grado k, il risultato è un polinomio di grado k +1. 

• ωk+1(x) = 

k 

x − xj 

j=0 

• ωk+1(xi) = 0, per i ≤ k 

dim. 

ωk+1(xi) = 

k 

(xi − xj) = (xi − x0) · . . . · (xi − xi) · . . . · (xi − xk) = 0 

j=0 

• ω0(x), . . . , ωk(x), costituiscono una base per Πk. 

Enunciamo allora il teorema per la definizione del polinomio interpolante con 

base di Newton: 

Teorema 24. I polinomi interpolanti che soddisfano i seguenti criteri di interpolazione, 

pr(x) ∈ Πr 

pr(xi) = fi , i = 0, . . . , r 

si possono generare in modo ricorsivo nel seguente modo: 

p0(x) = f0ω0(x) (5.14) 

pr(x) = pr−1 + f[x0, x1, . . . , xr]ωr(x), r = 1, . . .,n (5.15) 

f[x0, x1, . . . , xr] è la differenza divisa , ed è definita così: 

f[x0, x1, . . . , xr] = 

r 

k=0 

r 

j=0,j=k 

fk 

(xk − xj) 

(5.16) 

dim.(per induzione) La base della dimostrazione è verificata, perché quando 

r = 0, per definizione (vedi 5.11), abbiamo che 

p0(x) = f0ω0(x) = f0 

Per ipotesi supponiamo che la tesi sia dimostrata per r − 1. Dimostriamo che 

pr(x) ∈ Πr. ωr(x) ∈ Π ′ r, inoltre per ipotesi induttiva, pr−1(x) ∈ Πr−1;Risulta 

evidente che sommando pr−1(x) e f[x0, . . .,xr]ωr(x) si ottiene che pr(x) ∈ Πr. 

Si distinguono due casi 

• i < r 

pr(xi) = pr−1(xi) + f[x0, . . . , xr]ωr(xi) = pr−1(xi) = fi 

ωr(xi) = 0 e pr−1(xi) = fi risulta vero per ipotesi induttiva. 

85

• i = r 

pr(xr) = pr−1(xr) + f[x0, . . . , xr]ωr(xi) = pr−1(xr) = fr 

L’ultima uguaglianza, è stata imposta.Esprimiamo la differenza divisa in 

funzione di fr. 

f[x0. . . . xr] = fr − pr−1(xr) 

(5.17) 

ωr(xr) 

Dobbiamo dimostrare che la 5.16 e la 5.17 hanno la stessa forma. 

f[x0. . . . xr] = fr − pr−1(xr) 

ωr(xr) 

= fr pr−1(xr) 

− 

ωr(xr) ωr(xr) 

Esprimiamo il polinomio di grado r nella forma di Lagrange (vedi 5.9): 

fr 1 

− 

r−1 

r−1 

(xr − xj) (xr − xj) 

j=0 

fr 

j=0 

= 

− 

r−1 

(xr − xj) 

j=0 

fr 

= 

r−1 

(xr − xj) 

j=0 

fr 

= 

r−1 

(xr − xj) 

j=0 

= 

fr 

1 

xr − xk 

r−1 

− 

 

r−1 

· fk · 

fk 

k=0 

r−1 

· 

k=0 

xr − xk 

k=0 

r−1 

+ 

= 

r−1 

(xr − xj) 

j=0 

r 

j=0,j=r 

fr 

(xr − xj) 

= 

xk − xr 

k=0 

r 

k=0 

fk 

r−1 

+ 

k=0 

r−1 

+ 

r 

k=0 

j=0,j=k 

· 

· 

r 

j=0,j=k 

fk 

r−1 

j=0,j=k 

r−1 

j=0,j=k 

r−1 

j=0,j=k 

r−1 

j=0,j=k 

r−1 

j=0,j=k 

r 

fk 

j=0,j=k 

(xk − xj) 

fk 

(xr − xj) 

(xk − xj) 

(xk − xj) 

1 

(xk − xj) 

1 

(xk − xj) 

fk 

(xk − xj) 

= 

(xk − xj) 

Teorema 25. Mostriamo le proprietà delle quali gode la differenza divisa: 

86 

= 

= 

= 

= 

=

• Se 

Allora 

f , g : [a, b] → R α, β ∈ R 

(α · f + β · g)[x0, . . . , xr] = α · f[x0, . . . , xr] + β · g[x0, . . . , xr] (5.18) 

• Per ogni {i0, i1, . . .,ir} permutazione dell’insieme {0, 1, . . ., r} risulta che 

f[xi0, xi1, . . .,xir] = f[x0, x1, . . . , xr] (5.19) 

In definitiva questa proprietà dice che cambiando l’ordine delle ascisse la 

differenza divisa non cambia. 

• Sia f ∈ Πl con l ≤ r, allora 

dim. 

pr(x) = 

f[x0, x1, . . .,xr] = 

ak se l = r 

0 se l < r 

(5.20) 

n 

akx k = f[x0]+f[x0, x1]ω1(x)+. . .+f[x0, x1, . . . , xr]ωr(x) ≡ f(x) 

k=0 

• Se f ∈ C (r) ([a, b]), insieme di funzioni derivabili r volte, allora 

• 

f[x0, x1, . . . , xr] = f(r) (ξ) 

r! 

ξ ∈ [min 

i xi, max 

k xk] (5.21) 

⎧ 

⎨ f0 ≡ f(x0) se r = 0 

f[x0, x1, . . .,xr] = 

⎩ f[x1,...,xr]−f[x0,...,xr−1] 

altrimenti 

xr−x0 

(5.22) 

dim.(per induzione) Verifichiamo che la base k = 1 è soddisfatta. Per 

definizione abbiamo che 

f[x0, x1] = 

1 

i=0 

1 

j=0,j=i 

fi 

(xi − xj) 

= 

f0 

x0 − x1 

+ f1 

x1 − x0 

= f1 − f0 

x1 − x0 

La base quindi è soddisfatta. Per ipotesi induttiva risulta vero fino a k- 

1. Partendo dalla definizione otteniamo la differenza di ordine k da due 

differenze divise di ordine k − 1. 

f[x1, . . . , xk]−f[x0, . . .,xk−1] = 

k 

i=1 

87 

k 

j=1,j=i 

fi 

(xi − xj) 

k−1 

− 

i=0 

k−1 

j=1,j=i 

fi 

(xi − xj) 

=

Moltiplichiamo il numeratore e il denominatore del primo addendo per 

(xi − x0) e del secondo addendo per (xi − xk), in modo tale da rendere i 

denominatori e le sommatorie uguali 

= 

k 

i=0 

k 

j=0,j=i 

= 

fi 

k 

i=0 

(xi − xj) 

fi(xi − x0) 

k 

− 

(xi − xj) 

j=0,j=i 

k 

i=0 

fi(xi − xk) 

k 

(xi − xj) 

j=0,j=i 

·(xi−x0−xi+xk) = (xk −x0)· 

k 

i=0 

k 

j=0,j=i 

fi 

(xi − xj) 

Presentiamo adesso un algoritmo per il calcolo di un punto x in un polinomio. 

Algoritmo 5.4 (Agoritmo di Horner). 

function p=horner(a,x) 

%INPUT 

% a il vettore dei coefficienti 

% del polionomio p e del quale si vuole calcolare 

% p(x) 

% x il punto per il quale si calcola p(x) 

n=length(a); 

p=Coefficienti(n); 

for i=n-1:-1:1 

p=x*p +a(i); 

end 

Il funzionamento del precedente algoritmo è molto semplice. Come abbiamo 

già visto, la forma canonica del polinomio è: 

p(x) = 

Sviluppando la sommatoria otteniamo: 

n 

akx k 

k=0 

p(x) = a0 + a1x + a2x 2 + . . . + anx n 

manipoliamo questa espressione per avere una forma ricorsiva 

p(x) = a0 + x(a1 + x(a2 + x(. . . + x(an)))) 

Presentiamo l’algoritmo per il calcolo della differenza divisa di ordine n 

Algoritmo 5.5 (Algoritmo per il calcolo della differenza divisa). 

88

function f=differenzaDivisa(x,f,n) 

%Questa function calcola le differenze divise 

%fino all’ordine n. 

% 

%INPUT 

% x il vettore delle ascisse 

% f il vettore delle ordinate ottenute da f(x) 

% n l’ordine della differenza divisa 

if(n>length(x)-1) 

message1=(’La differenza divisa non pu avere un ordine ’); 

message2=(’maggiore del numero delle ascisse pi uno’); 

error([message1,message2]); 

end 

for i=1:n 

for j=n+1:-1:i+1 

f(j)=(f(j)-f(j-1))/(x(j)-x(j-i)); 

end 

end 

Algoritmo 5.6 (Algoritmo di Hornerper la valutazione del polinomio interpolante 

di Newton). 

function p=hornerNewton(xx,x,f,n) 

% 

%hornerNewton, calcola il valore del polinomio 

%interpolante nei punti dati dal vettore xx 

% 

%INPUT 

% xx punti da valutare 

% x ascisse del polinomio 

% f vettore delle differenze divise 

P=zeros(1,length(f)); 

n=length(f)-1; 

l=length(xx); 

for i=1:l 

p(i)=f(n+1) 

for k=n:-1:1 

p(i)=f(k)+(p(i)*(xx(i)-x(k))); 

end 

end 

Come è stato fatto per l’algoritmo 5.4, dimostriamone la correttezza. Il 

89

polinomio con interpolante con la base di Newton, ha la seguente forma: 

pn(x) = 

n 

f[x0, . . .,xi]ωi(x) 

i=0 

Sviluppando la sommatoria e rinominando per semplicità la differenza divisa 

f[x0, . . . , xi] con Ai, otteniamo 

pn(x) = A0ω0(x) + A1ω1(x) + . . . + Anωn(x) 

Sostituaimo il simbolo di omega con la parte destra dell’equazione della definizione 

5.13 della base di Newton. 

pn(x) = A0 ·1+A1 ·(x−x1)+A2 ·(x−x1)(x−x2)+. . .+An ·(x−x1)...(x−xn) 

Mettiamo in evidenza i fattori (x − xi) 

A0 + (x − x1) · (A1 + (x − x2) · (A2 + (x − x3) · (. . . An−1 + (x − xn) · (An)))) 

5.3 Interpolazione di Hermite 

L’idea che sta alla base dell’interpolazione di Hermite, è quella di interpolare in 

un punto sia la funzione sia la sua derivata. Questo è possibile grazie a qualche 

accorgimento. Le ascisse quindi saranno un numero dispari: 

n = 2m + 1, m = 0, 1, . . . (5.23) 

Supponiamo queste ascisse tutte distinte. Se facciamo tendere le ascisse di indice 

dispari, all’ascissa di indice pari minore 

x2i+1 −→ x2i i = 0, 1, . . ., m 

e supponendo che la funzione da interpolare f(x) ∈ C (1) , possiamo scrivere 

f(x2i+1) − f(x2i) 

x2i+1 − x2i 

= f[x2i, x2i+1] −→ f ′ (x2i) i = 0, 1, . . .,m (5.24) 

Come possiamo notare dall’equazione precedente, il rapporto incrementale è 

proprio la differenza divisa, e se x2i+1 −→ x2i, questo tende alla derivata della 

funzione nel punto x2i. Risulta quindi che 

p(x2i) = f(x2i), p ′ (x2i) = f ′ (x2i), i = 0, 1, . . ., m 

Rinumerando le ascisse nel seguente modo 

x0 = x0 < x1 = x1 < . . . < xm = xm 

possiamo esprimere il polinomio di Hermite: 

(5.25) 

p(x) = f[x0] + f[x0, x0](x − x0)+ 

+f[x0, x0, x1](x − x0) 2 + 

+f[x0, x0, x1, x1](x − x0) 2 (x − x1)+ 

+f[x0, x0, x1, x1, x2](x − x0) 2 (x − x1) 2 + . . .+ 

+ . . . + f[x0, x0, x1, x1, . . .,...,xm, xm](x − x0) 2 . . . (x − xm−1) 2 (x − xm) 

90

5.4 Errore nell’interpolazione 

In questa sezione vogliamo valutare l’errore di interpolazione come una differenza: 

en(x) = f(x) − pn(x) (5.26) 

Evidentemente, en(xi) = 0 per ogni i = 0, . . .,n, in quanto deve soddisfare le 

condizioni di interpolazione (vedi 5.1 e 5.2). Se prendiamo un punto generico 

ˆx = xi per i = 0, 1, . . ., n risulta che: 

 

ˆpn(xi) = fi i = 0, . . .,n 

ˆpn+1(x) ∈ Πn+1 

ˆpn(ˆx) = f(ˆx) 

Quindi 

Risulta inoltre che 

In più se f ∈ C n+1 allora 

ˆpn+1(ˆx) = pn(ˆx) + f[x0, . . . , xn, ˆx] · ωn+1(ˆx) = f(ˆx) 

e(ˆx) = f(ˆx) − pn(ˆx) = f[x0, . . . , xn, ˆx] · ωn+1(ˆx) 

en(x) = fn+1 (ξ) 

(n + 1)! ωn+1(x) ξ ∈ (min 

i xi, max 

i xi) (5.27) 

Riguardo a questa ultima espressione di e(x), possiamo fare alcune considerazioni: 

• Se x ∈ {xi} con i = 0, . . .n, allora ωn+1(x) si annulla e di conseguenza 

anche l’errore 

• Se x ∈ [x0, xn] e x = xi con i = 0, . . .n, allora l’errore oscilla intorno alla 

funzione in un range limitato. 

• Se non si verifica nessuna condizione delle precedenti, ovvero se x /∈ 

[x0, xn], allora |ωn+1(x)| ha l’andamento della funzione |x n+1 |. 

In definitiva, l’interpolazione a partire da un set di coppie (xi, fi), ha senso solo 

se si sceglie un x ∈ [x0, xn]. 

Esempio 24 (Stima errore di interpolazione). Siamo interessati a stimare quante 

ascisse equidistanti di interpolazione sono necessarie per approssimare la 

funzione sin(x) sull’intervallo [0, 2π], con un errore di interpolazione inferiore 

a 10 −6 . Prendendo in esame l’espressione 5.27 dell’errore di interpolazione, 

possiamo fare qualche analisi. Analiziamola fattore per fattore: 

• f (n+1) (ξx): la funzione sin in questo caso ci viene in aiuto e non ci complica 

le cose.Le derivate di questa funzione sono ±sin(x) e ±cos(x), a 

seconda dell’ordine della derivata.In ogni caso sappiamo che 

f (n+1) (ξx) ≤ 1 per ξx ∈ [0, 2π] 

• ωn+1(x): Nell’intervallo [0, 2π] possiamo dire che 

|x − xj| < 2π 

Quindi se consideriamo che l’intera produttoria della base di Newton è 

costituita da n + 1 fattori possiamo fare la seguente stima: 

|ωn+1(x)| < (2π) n+1 

91

Quindi stimiamo il nostro errore come 

en(x) = (2π)n+1 

(n + 1)! 

(5.28) 

Procediamo alla stima del valore di n, tale che la 5.28 sia minore di 10 6 , in 

modo non nalitico. La soluzione quindi è stata ottenuta col seguente script di 

matlab 

Algoritmo 5.7. 

f=inline(’((2*pi).^(x+1))./(factorial(x+1))’); 

n=0; 

tol=10^-6; 

while(f(n)>= tol) 

n=n+1; 

end 

printf(’L errore e’ inferiore a %d per n=%d’,tol,n); 

x=[0:1:40]; 

y=f(x); 

plot(x,y,’k’); 

Questo script restituisce in output il seguente risultato e il grafico dell’andamento 

dell’errore al crescere del numero di ascisse di interpolazione equidistanti. 

L errore e’ inferiore a 1.0000e-06 per n=26 

90 

80 

70 

60 

50 

40 

30 

20 

10 

(2 ⋅ π) (n+1) /(n+1)! 

0 

0 5 10 15 20 25 30 35 40 

Come si può vedere dal grafico, per valori di n < 5, il fattore ωn+1(x) domina 

sul fattoriale, facendo innalzare molto l’errore. Invece per valori di n > 6, il 

fattoriale prende il sopravvento, riducendo a zero l’errore per n → ∞. Come 

vedremo nella prossima sezione, risulta controproducente innalzare il numero di 

ascisse in modo indiscriminato. Infatti all’aumentare del numero delle ascisse 

il problema diventa mal condizionato. 

92

5.5 Condizionamento del problema 

Consideriamo il polinomio interpolante di grado n, pn(x), ottenuto dai dati 

in ingresso, ovvero le coordinate (xi, fi). Assumiamo che l’errore sui dati in 

ingresso sia solo sulla funzione e non sulle ascisse. Quindi i dati in ingresso 

risultano essere le coppie di valori (xi, ˜ fi), dove ˜ fi = ˜ f(xi). siamo interessati a 

valutare quindi 

|pn(x) − ˜pn(x)| (5.29) 

Il polinomio che usiamo per questo caso, è quello di Lagrange 

i=0 

p(x) = 

˜pn(x) = 

n 

fiLin(x) 

i=0 

n 

˜fiLin(x) 

i=0 

Quindi la 5.29 diventa 

 

n 

n 

 

 

 

|pn(x) − ˜pn(x)| = fiLin(x) − ˜fiLin(x) 

 

 

 

= 

 

n 

(fi − 

 

˜ 

 

 

fi) · Lin(x) 

< 

i=0 

i 

i=0 

n 

 

< (fi − ˜ 

 

fi) · Lin(x) ≤ max f(xi) − ˜ n 

 

 

 

f(xi) · |Lin(x)| ≡ max fi − 

i 

˜ 

 

fi·Λn 

Λn(x) è la funzione di Lebesgue, che dipende solo dalle ascisse di interpolazione. 

Consideriamo allora un intervallo [a, b]. Definiamo la norma di una funzione 

come 

||f|| = max 

a≤x≤b |f(x)| 

Da questa definizione otteniamo che 

i=0 

i=0 

||pn − ˜pn|| ≤ maxi|fi − ˜ fi| · ||Λn|| ≤ ||f − ˜ f|| · Λn 

(5.30) 

Λn in questo caso diventa la costante di Lebesgue. ||pn−˜pn|| rappresenta i dati in 

uscita, ||f − ˜ f|| rappresenta i dati in ingresso. Risulta evidente che Λn è il numero 

di condizionamento del problema. Ma come sono correlati l’approssimazione e 

l’errore? 

Teorema 26 (Polinomio di miglior approssimazione). Se f ∈ C (0) continua 

nell’intervallo [a, b], allora per ogni n ∈ N esiste p ∗ (x) ∈ Πn tale che 

||f − p ∗ || = min ||f − p|| 

p∈Πn 

p ∗ (x) ∈ Πn è il polinomio che meglio approssima f(x) di grado al più n. 

Teorema 27. 

dim. 

||e|| ≤ (1 + Λn) · ||f − p ∗ || 

||e|| = ||f − p|| = ||f − p ∗ + p ∗ − p|| ≤ ||f − p ∗ ||+||p − p ∗ || 

 

Λn||f−p ∗ ≤ (1+Λn)·||f − p 

|| 

∗ || 

93

Definizione 12. Si definisce modulo di continuità di una funzione il valore 

ω(f; h), dove 

ω(f; h) ≡ max {|f(x) − f(y)| : |x − y| ≤ h} (5.31) 

Proprietà: 

• Se f è continua, allora lim 

h→0 ω(f; h) = 0 

• Se f è Lipschitziana con costante L, allora ω(f; h) ≤ L·h f è Lipschitziana 

con costante L se 

|f(x) − f(y)| ≤ L · |x − y| 

Quindi se f ∈ C (1) allora L = ||f ′ ||. dim. 

Quindi L = f ′ . 

|f(x) − f(y)| = |f(x) − f(x) − f ′ (x)(x − y)| ≤ L · |x − y| 

Teorema 28 (Jackson). Se f ∈ C (0) allora esiste α indipendente da n tale che: 

Lemma 3. 

||f − p ∗ || ≤ α · ω(f; 

||e|| ≤ α · (1 + Λn) · ω(f; 

b − a 

) (5.32) 

n 

b − a 

n ) 

Al crescere di n, Λn cresce, mentre ω(f; b−a 

n ) decresce. 

Passando alle norme, l’equazione 5.27, diventa 

 

 

||e|| ≤ 

f (n+1) 

(n + 1)! 

||wn+1|| 

Per riuscire a minimizzare l’errore, dobbiamo agire sulla scelta delle ascisse di 

interpolazione. Notiamo però che il primo fattore del secondo membro non 

dipende da questa scelta. Per questo il problema di minimizzare l’errore si 

riduce a minimizzare la quantità ||ωn+1||. In definitiva il nuovo problema da 

risolvere è: 

min 

a≤x0

Delle proprorzioni sappiamo che il prodotto degli estremi è uguale al prodotto 

dei medi. Quindi abbiamo che 

˜x = 

b − a 

2 

Questo appunto rappresenta l’offset dal centro dell’intervallo. 

Teorema 30. Per ogni a, b, se ˜x ∈ [a, b], allora x ∈ [−1, 1], dove 

x = 

· x 

2˜x − a − b 

b − a 

Come prima l’offset è individuato, ricavando la x dalla proporzione 5.34 ottendendo: 

x = 2˜x 

b − a 

Affinché al x ∈ [−1, 1] dobbiamo sottrarre la quantità b+a 

b−a . 

Teorema 31. È sempre possibile trasformare un problema di interpolazione definito 

sulle ascisse nell’intervallo [a, b], in uno definito sulle ascisse dell’intervallo 

[−1, 1] e viceversa. La dimostrazione discende immediatamente dai teroremi 

29 e 30 

5.6 Ascisse di Chebyshev 

Definizione 13 (Polinomi di Chebishev di prima specie). Si definiscono in 

modo ricorsivo: 

Proprietà: 

T0(x) ≡ 1 (5.35) 

T1(x) = x (5.36) 

Tk+1(x) = 2xTk(x) − Tk−1(x), k = 1, 2, . . . (5.37) 

• Tk(x) è un polinomio di grado esatto K. 

• Il coefficiente principale di Tk(x) è 2 k−1 per k ≥ 1. 

• Le famiglie di polinomi ˆ Tk(x) = 2 1−k Tk(x) è una famiglia di polinomi 

monici di grado k. 

• Sia x = cosθ con θ ∈ [0, π], allora possiamo parametrizzare i punti 

dell’intervallo [−1, 1] rispetto a θ, ottenendo: 

dim.(per induzione) 

Per k = 0 è ovvio. 

Tk(x) ≡ Tk(cosθ) = coskθ 

T0(x) ≡ 1 Per definizione ma cos0 ≡ 1 

95

Per k + 1 abbiamo che 

Tk+1(cosθ) = 2 cosθTk(cosθ)−Tk−1(cos θ) = 2 cosθ coskθ−cos(k − 1)θ = 

= 2 cosθ coskθ − (coskθ cosθ + sin kθ sin θ) = 

2 cosθ coskθ − cosθ coskθ − sin θ sin kθ = cos(k + 1)θ 

• Le radici di Tk(x) sono date da 

x (k) 

 

2i + 1 π 

i = cos 

k 2 

• ||Tk|| = 1 

 

 

• 

ˆ 

 

Tk 

= 

1−k 2 Tk 

1−k = 2 

• 

 

 

 

ˆ 

 

Tk 

= min 

p∈Π ′ n+1 

||p|| = 2 1−k 

i = 0, . . .,k − 1 

Scegliendo le seguenti ascisse di interpolazione per l’intervallo [−1, 1] 

 

(2i + 1)π 

xi = cos 

(5.38) 

2(n + 1) 

si ottiene 

ωn+1(x) = 

n 

(x − xi) ≡ ˆ Tn+1(x) (5.39) 

i=0 

che risulta essere la soluzione per il problema di minmassimo 5.33 Con la scelta 

dei nodi 5.38, otteniamo il seguente errore 

 

 

||e|| = 

f (n+1) 

(n + 1)!2n (5.40) 

Di conseguenza, la costante di Lebesgue diventa 

Λn ≈ 2 

log n (5.41) 

π 

Questa costante risulta avere un buon andamento per n → ∞. Se volessimo 

generalizzare le ascisse 5.38 per un generico intervallo [a, b], la definizione delle 

ascisse cambierebbe in 

xn−i = 

 

a + b b − a (2i + 1)π 

cos 

2 2 2(n + 1) 

5.7 Interpolazione mediante funzioni spline 

(5.42) 

Vediamo adesso un altro apporccio per approssimare una funzione e minimizzare 

l’errore: 

b − a 

||e|| ≤ α · (1 + Λn) · ω(f; 

n ) 

96

Abbiamo visto che al crescere di n, la costante Λn cresce. Se invece n assume 

valori bassi, l’ultimo fattore, non può avere valori bassi. Consideriamo allora la 

partizione ∆ = {a = x0, < x1 < . . . < xn = b}, per la quale si abbia 

h = max 

i=1,...,n (xi − xi−1) → 0 per n → ∞ (5.43) 

Su ogni sottointervallo [xi, xi−1], prendiamo il polinomio di grado m (fissato a 

priori), che interpola la funzione nei punti estremi all’ntervallo, ovvero 

pm(xi) = f(xi) 

pm(xi−1) = f(xi−1) 

(5.44) 

Così facendo, il condizionamento del problema rimane sotto controllo, essendo 

m fissato. In più se f ∈ C (0) , il fattore ω(f; h) → 0 per n → ∞ 

Definiamo spline di grado m sulla partizione ∆ la funzione che ha i seguenti 

requisiti: 

• sm(x) ∈ C (m−1) nell’intervallo [a, b] 

 

 

[xi−1,xi](x) ∈ Πm per i = 1, . . .,n 

• sm 

Inoltre se vale la seguente condizione 

sm(xi) = fi per i = 0, 1, . . ., n (5.45) 

la spline interpola la funzione nei nodi della partizione. Sappiamo che sono 

necessarie m + n condizioni indipendenti per determinare in modo univoco la 

spline interpolante nella partizione ∆. Noi però abbiamo n + 1 condizioni di 

interpolazione, e questo ci consente di di individuare univocamente solo le spline 

di grado 1, ovvero le spline lineari. La spline lineare viene individuata dalla 

seguente equazione 

 

s1 

[xi−1,xi](x) = (x − xi−1)fi + (xi − x)fi−1 

(xi − xi−1) 

i = 1, . . .,n (5.46) 

Esempio 25 (spline lineare). Matlab, mette a disposizione la funzione interpol. 

Il codice per l’esempio è il seguente: 

xx=[0:0.02:10]; 

x=[0:1:10]; 

y=sin(x); 

yy=interp1(x,y,xx,’linear’); 

plot(xx,yy,’k’); 

La funzione da interpolare è sin(x) nelle ascisse della partizione ∆ = [0, 1, . . .,10]. 

I parametri di input sono i vettori delle ascisse e delle ordinate dei nodi 

di interpolazione (x e y), il vettore delle ascisse di valutazione del polinomio 

interpolante, e il tipo di interpolazione. Se xx è un vettore, allora yy = s1(xx); 

La figura 5.2, mostra la spline interpolante la funzione sin(x) sui nodi (xi, yi). 

97

1 

0.8 

0.6 

0.4 

0.2 

0 

−0.2 

−0.4 

−0.6 

−0.8 

−1 

0 1 2 3 4 5 6 7 8 9 10 

5.8 Spline cubiche 

Figura 5.2: Grafico della spline lineare. 

La spline cubica prende il suo nome dal grado del polinomio interpolante che 

è 3. Ci sono vari tipi di spline cubiche, a seconda delle condizioni imposte per 

l’unicità. 

• Spline naturale 

La condizione aggiuntiva da imporre è 

s ′′ 

3(a) = 0 s ′′ 

3(b) = 0 (5.47) 

• not-a-knot 

Le condizioni per definire una spline not-a-knot, sono le seguenti 

s ′′ 

3(x1) − s ′′ 

3(x0) 

x1 − x0 

s ′′ 

3(xn) − s ′′ 

3(xn − 1) 

xn − xn−1 

= s′′ 3(x2) − s ′′ 

3(x1) 

= s′′ 

x2 − x1 

3(xn−1) − s ′′ 

3(xn−2) 

xn−1 − xn−2 

(5.48) 

(5.49) 

Teorema 32. s ′′′ 

 

 

 

3 [xi,xi−1](x) ∈ Π0. Infatti se sm 

[xi,xi−1](x) ∈ Πm la sua 

derivata prima sarà un polinomio di grado m − 1. Procedendo per induzione 

si vede facilmente che la sua derivata m-esima è un polinomio appartentente a 

Π0. 

5.9 Calcolo spline cubica 

Per semplicità ridefiniamo le seguenti variabili 

mi = s ′′ 

3(xi) i = 0, 1, . . .,n (5.50) 

hi = xi − xi−1 i = 0, 1, . . .,n (5.51) 

98

Con queste definizioni, le condizioni 5.48 e 5.49 diventano: 

(h1 + h2)m1 = h2m0 + h1m2 (5.52) 

(hn−1 + hn)mn−1 = hnmn−2 + hn−1mn (5.53) 

Infatti sostituendo la parte destra con la parte sinistra delle equazioni 5.50 e 

5.51, abbiamo che 

m1 

h1 

m1 

h1 

− m0 

h1 

+ m1 

h2 

h2m1 + h1m1 

h1h2 

= m2 

h2 

= m0 

h1 

− m1 

h2 

+ m2 

h2 

= h2m0 + h1m2 

h1h2 

m1(h2 + h1) = h2m0 + h1m2 

(5.54) 

Analogamente si può fare per la seconda condizione not-a-knot 5.49, che diventa 

mn−1(hn + hn−1) = hnmn−2 + hn−1mn 

(5.55) 

Dal teorema 32, se s3(x) è una spline cubica allora s ′ 3 (x) è una spline di secondo 

grado e s ′′ 

3(x) è una spline lineare. Quindi possiamo scrivere che 

s ′′ 

 

 

3 [xi,xi−1](x) = (xi − xi−1)mi + (xi − x)mi−1 

hi 

Integrando la precedente equazione otteniamo 

 

s ′′ 

 

 

3 [xi,xi−1](x) = s ′ 3(x) = (x − xi−1) 2mi + (xi − x) 2mi−1 + qi 

2hi 

(5.56) 

(5.57) 

dove qi è la costante di integrazione.Reintegrando ulteriormente otteniamo 

 

s ′ 

 

3 [xi,xi−1](x) = s3(x) = (x − xi−1) 3mi + (xi − x) 3mi−1 + qi(x − xi−1) + ri 

6hi 

(5.58) 

dove ri è un altra costante di integrazione. Calcoliamo adesso le due costanti 

di integrazione qi e ri. Dobbiamo imporre la condizione di interpolazione 5.45. 

Così sostituendo in x il valore xi−1, otteniamo 

 

s3 

[xi−1,xi](xi−1) = h2i 6 mi−1 + ri = fi−1 

Ricaviamo ri dll’espressione precedente: 

ri = fi−1 − h2 i 

6 mi−1 

(5.59) 

(5.60) 

Analogamente imponiamo la condizione di interpolazione al fine di ricavare la 

costante di integrazione qi 

 

s3 

[xi−1,xi](xi) = h2i 6 mi + qihi + fi−1 − h2i 6 mi−1 

 

99 

ri 

= fi 

(5.61)

qi = fi − fi−1 

hi 

− mi − mi−1 

hi = f[xi−1, xi] − 

6 

hi 

6 (mi − mi−1) (5.62) 

Quindi l’equazione della derivata prima della spline cubica diventa 

s ′ 

 

3 [xi−1,xi](x) = (x − xi−1) 2mi + (xi − x) 2mi−1 + f[xi−1, xi] − 

2hi 

hi 

6 (mi − mi−1) 

(5.63) 

Ancora i valori mi sono incogniti.Per calcolarli dobbiamo imporre la condizione 

s ′ 

 

3 [xi−1−xi](xi) = s ′ 

 

3 [xi−xi+1](xi) (5.64) 

Dalla 5.64 e 5.63, otteniamo 

hi 

2 mi+f[xi−1, xi]− hi 

6 (mi−mi−1) = − hi + 1 

2 mi+f[xi, xi+1]− hi+1 

6 (mi+1−mi) 

(5.65) 

Moltiplicando per 6 e portando a primo membro le incognite mi, otteniamo: 

himi−1 + mi(2hi + 2hi+1) + hi+1mi+1 = 6(f[xi, xi+1] − f[xi−1, xi]) (5.66) 

Per accorpare le due differenze divise in una, utiliziamo la proprietà 5.22. Per 

poter sfruttare tale proprietà dobbiamo dividere entrambi i membri per 

Siano 

allora la 5.66, diventa 

ϕi = 

ξi = 

xi+1 − xi−1 = hi + hi+1 

hi 

hi + hi+1 

hi+1 

hi + hi+1 

i = 1, . . .,n (5.67) 

i = 1, . . .,n (5.68) 

ϕimi−1 + 2mi + ξimi+1 = 6f[xi−1, xi, xi+1] (5.69) 

Dobbiamo quindi risolvere il seguente sistema 

⎛ 

2 

⎜ϕ2 

⎜ 

⎝ 

ξ1 

2 

. .. 

ξ2 

. .. 

ϕn−2 

. .. 

2 

⎞⎛ 

⎞ ⎛ 

m1 

⎟⎜ 

m2 ⎟ ⎜ 

⎟⎜ 

⎟ ⎜ 

⎟⎜ 

⎟ ⎜ 

⎟⎜ 

⎟⎜ 

. ⎟ = 6 ⎜ 

ξn−2⎠ 

⎜ ⎟ ⎜ 

⎝ . ⎠ ⎝ 

f[x0, x1, x2] 

f[x1, x2, x3] 

. 

. 

⎞ 

⎟ 

⎠ 

ϕn−1 2 

f[xn−2, xn−1, xn] 

mn−1 

(5.70) 

Osserviamo che per ogni i = 1, . . . , n, ξi +ϕi = 1 < 2. La matrice quindi risulta 

diagonale dominante per righe, e di conseguenza fattorizzabile LU, dove L ed 

U sono così definiti: ⎛ 

1 

⎞ 

⎜ 

⎜l2 

L = ⎜ 

⎝ 

. .. 

. .. . .. 

⎟ 

⎠ 

(5.71) 

100 

ln−1 1

dove 

⎛ 

⎜ 

U = ⎜ 

⎝ 

u1 = 2 , li+1 = ϕi+1 

ui 

u1 ξ1 

. .. 

. .. 

⎟ 

. ⎟ 

.. ξn−2 

⎠ 

un−1 

⎞ 

, ui+1 = 2 − li+1ξi per i = 1, . . .,n − 2 

Il sistema 5.70 si risolve quindi ponendo 

Ly = b con 

 

y1 = b1 

yi = bi − liyi−1 i = 2, . . .,n − 1 

Um = y con 

mn−1 = yn−1 

un−1 

mi = (yi−ξimi+1) 

un 

i = n − 2, . . .,1 

(5.72) 

La prova della consistenza dei fattori L ed U, può essere verificata tramite la 

loro moltiplicazione. Chiamiamo A la matrice dei coefficienti del sistema lineare 

5.70. La prima riga ha in prima e seconda posizione i seguenti elementi: 

A1,1 = 1 · u1 = u1 = 2 

A1,2 = 1 · ξ1 + 0 · u2 = ξ1 

La prima riga della matrice A infatti corrisponde alla matrice dei coefficienti del 

sistema 5.70. Per una i-esima riga si verifica che 

Ai,i−1 = ξi−2 · 0 + l1 · ui−1 + 1 · 0 = ϕi 

Ai,i = li · ξi−1 + 1 · ui = 

Ai,i+1 = 1 · ξi = ξi 

ui−1 

 

ϕi 

ξi−1 

uu−1 

· ui−1 = ϕi 

 

+ 2 − 

 

ϕi 

ξi−1 

uu−1 

 

= 2 

Analogamente alla prima riga si può procedere per l’ultima riga. I risultati di 

tale fattorizzazione, i coefficienti mi, dovranno poi essere sostituiti nell’equazione 

5.58, tenendo conto delle definizioni delle costanti di integrazione. Questo 

procedimento che abbiamo seguito è valido per la spline cubica naturale. Per il 

calcolo della spline cubica con condizione not-a-knot, dobbiamo imporre le condizioni 

5.54 e 5.55. Rispettando queste imposizioni e considerando l’equazione 

5.69, otteniamo il sistema lineare 

⎛ 

⎜ 

⎝ 

ξ1 −1 ϕ1 

ϕ1 2 ξ1 

. .. 

. .. 

. .. 

ϕn−1 2 ξn−1 

ξn−1 −1 ϕn−1 

⎞⎛ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎠⎝ 

m0 

m1 

. 

. 

mn−1 

mn 

⎞ ⎛ 

⎞ 

0 

⎟ ⎜ 

⎟ ⎜ f[x0, x1, x2] ⎟ 

⎟ ⎜ 

⎟ = 6 

. ⎟ 

⎜ 

⎟ ⎜ . ⎟ 

⎠ ⎝f[xn−2, 

xn−1, xn] ⎠ 

0 

(5.73) 

Se nella matrice sostituisco la prima riga con la somma della prima e della 

seconda riga, e sostituisco l’ultima, con la somma dell’ultima e della penultima 

101

iga, ottengo: 

⎛ 

1 1 1 

⎜ϕ1 

⎜ 2 ξ1 

⎜ 

. .. . .. 

⎜ 

⎝ 

. .. 

ϕn−1 2 ξn−1 

1 1 1 

⎞⎛ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎟⎜ 

⎠⎝ 

m0 

m1 

. 

mn−1 

mn 

⎞ ⎛ 

⎞ 

f[x0, x1, x2] 

⎟ ⎜ 

⎟ ⎜ f[x0, x1, x2] ⎟ 

⎟ ⎜ 

⎟ 

⎟ = 6 ⎜ 

⎟ ⎜ . ⎟ 

⎠ ⎝f[xn−2, 

xn−1, xn] ⎠ 

f[xn−2, xn−1, xn] 

(5.74) 

Adesso si sottrae alla seconda e terza colonna la prima, alla n − 2esima e n − 

1esima la n-esima. Ottenendo quindi 

⎛ 

1 

⎜ϕ1 

⎜ (2 − ϕ1) (ξ1 − ϕ1) 

⎜ ϕ2 ⎜ 

2 ξ2 

⎜ 

. .. . .. 

⎜ 

ϕn−2 2 

⎝ 

(ξn−1 − ϕn−1) 

. .. 

ξn−2 

(2 − ϕn−1) 

⎞ ⎛ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

ϕn−1⎠ 

⎝ 

1 

m0 

. 

. 

⎛ 

⎞ 

f[x0, x1, x2] 

⎜ 

f[x0, x1, x2] ⎟ 

⎜ 

⎟ 

⎜ 

= 6 ⎜ . ⎟ 

⎜ 

⎟ 

⎜ . ⎟ 

⎝f[xn−2, 

xn−1, xn] ⎠ 

f[xn−2, xn−1, xn] 

(5.75) 

m0 + m1 + m2 

mn−1 

mn + mn−1 + mn−2 

Considerando che la matrice ha tutti i minori principali non nulli, la matrice 

stessa risulta fattorizzabile LU. 

5.10 Approssimazione polinomiale ai minimi quadrati 

Spesso ci si trova a dover approssimare una funzione di tipo polinomiale, dove 

i dati di ingresso sono ottenuti sperimentalmente o con modelli matematici che 

simulano un comportamento fisico. Tali dati non sono esatti. Si avrà quindi 

il vettore dei dati osservati f = (f0, . . . , fn) T ∈ R n+1 , e per ognuno di questi 

valori, si avrà il valore atteso y = (y0, . . . , yn) T ∈ R n+1 . Cosa vuol dire che 

pm(xi) ≈ fi? Si chiama soluzione ai minimi quadrati, il minimo della norma 

euclidea di f − y, ovvero 

L’equazione del polinomio esatto è 

min ||f − y|| 

pm∈Πn 

2 

2 

yi = pm(xi) = (x 0 i , x 1 i,...,x m i ) · (a0, a1, . . .,an) T 

Posso scegliere allora y = V a, dove V è la matrice di Van der Monde 

⎛ 

⎞ 

⎜ 

V = ⎜ . 

⎜ 

⎝ . 

x 0 0 x 1 0 . . . x m 0 

. 

. 

x 0 n x 1 n . . . x m n 

102 

. 

. 

⎟ 

⎠ 

(5.76) 

(5.77) 

⎞ 

⎟ = 

⎟ 

⎠

Il problema dei minimi quadrati diventa 

min ||f − y|| 

pm∈Πn 

2 

2 = min 

a∈Rn+1 ||V a − f|| 2 

2 

Siccome il rango di V è m + 1, ovvero massimo, V risulta fattorizzabile QR. 

 

ˆR 

V = QR ≡ Q 

0 

dove QTQ = In+1, e ˆ R, R ∈ Rn+1×m+1 Quindi l’equazione 5.76, la possiamo 

riscrivere come 

||QRa − f|| 2 

2 = Q(Ra − Q T f) 2 2 = 

 

2 

 

ˆR 

 

 

a − g 

0 

(5.78) 

dove g = QTf.Partizioniamo g nel seguente modo 

 

g1 

g = dove g1 ∈ R m+1 , g2 ∈ R n−m 

g2 

Allora possiamo continuare la trasformazione dell’equazione 5.78 

 

 

 

ˆ 

 

Ra − g1 

2 

2 + ||g2|| = ||g2|| 2 

2 

2 

(5.79) 

(5.80) 

L’equazione vista sopra è vera se e solo se ˆ Ra = g1. Scegliamo allora a = ˆ R −1 g1. 

Si osserva che se m = n allora anche g2 = 0, e quindi i dati vengono interpolati 

esattamente e non approssimati. 

103

Capitolo 6 

Formule di quadratura 

In questo capitolo siamo interessati a capire come una perturbazione sulla funzione 

integrata su ripercuote sull’integrale. Vedremo poi qualche metodo per 

approssimare integrali definiti. 

6.1 Metodo di Newton-Cotes 

L’integrale, espresso come funzione di f, è così definito: 

I(f) = 

b 

a 

f(x)dx (6.1) 

Senza perdita di generalità, considereremo che a 

[a, b]. Se chiamiamo ˜ f, la funzione perturbata da integrare, il condizionamento 

dell’approssimazione di un integrale definito dato da 

 

 

I(f) − I( ˜ 

 

f) = 

 

 

 

 

 

b 

a 

x∈[a,b] 

f(x)dx 

b 

a 

 

 

˜f(x)dx 

 

 

= 

 

 

 

 

 

 

 

≤ max f(x) − ˜ 

 

f(x) · 

b 

a 

b 

a 

f(x) − ˜ 

 

 

f(x)dx 

≤ 

Risulta quindi chiaro che 

 

 

I(f) − I( ˜ 

 

f) = (b − a) · f 

− 

 

K 

errore in output 

˜ 

 

f 

 

errore in input 

b 

a 

 

 

f(x) − ˜ 

 

f(x)dx 

≤ 

 

 

dx = (b − a) · f 

− ˜ 

 

f 

(6.2) 

In definitiva il numero di condizionamento per l’approssimazione di un integrale 

definito, è proprio l’ampiezza dell’intervallo di integrazione. L’idea per approssimare 

l’integrale di una funzione, è di calcolare l’integrale dell’approssimazione 

di una funzione più facilmente integrabile. Ovvero 

I(f) = 

b 

a 

f(x)dx ≈ 

b 

a 

pn(x)dx ≡ In(f) 

Consideriamo allora una partizione dell’intervallo [a, b] così definita: 

xi = a + i · h i = 0, . . .,n dove h = 

104 

b − a 

n 

(6.3)

Se il polinomio interpolante la funzione lo sostituiamo con quello di Lagrange, 

otteniamo: 

In(f) = 

b 

a 

pn(x)dx = 

b 

a 

n 

Lin(x)fidx = 

i=0 

Ponendo i = t nell’equazione 6.3 otteniamo 

n 

i=0 

x = a + th dove 0 ≤ t ≤ n 

Con tale sostituzione i polinomi di Lagrange diventano 

Lin(x) = 

n 

x − xj 

xi − xj 

j=0,j=i 

= 

n 

j=0,j=i 

a + th − (a + jh) 

a + ih − (a + jh) = 

fi 

b 

n 

a 

j=0,j=i 

Lin(x)dx 

(t − j)h 

(i − j)h = 

Pertanto l’approssimazione dell’integrale con i polinomi di Lagrange, risulta 

Ovvero 

Dove 

Distinguiamo alcuni casi: 

n=1 

n=2 

Siccome 

si ha che 

Quindi 

b − a 

n 

n 

i=0 

fi 

In(f) = 

c (n) 

i = 

n 

0 

n 

0 

b − a 

n 

c (1) 

0 

c (1) 

0 

n 

j=0,j=i 

n 

n 

i=0 

j=0,j=i 

+ c(1) 

1 

t − j 

i − j dt 

n 

j=0,j=i 

c (n) 

i fi (6.4) 

t − j 

i − j dt 

= 1 

= 1 − c(1) 

1 

c (1) 

1 = 

1 

t 1 

dt = 

0 1 − 0 2 

I1(f) = 

c (2) 

0 

c (1) 

0 

b − a 

2 

= 1 

2 

(f(a) + f(b)) (6.5) 

+ c(2) 1 + c(2) 2 = 2 

c (2) 

2 = 

2 

t · (t − 1) 1 

dt = 

0 2 · (1 − 0) 2 · 

 

3 2 

t t2 

− = 

3 2 0 

1 

3 

c (2) 

0 = 

2 

2 

(t − 1) · (t − 2) 1 

1 

dt = · (t(t − 1) − 2(t − 1))dt = 

0 2 · 1 0 2 3 

105 

t − j 

i − j

I2(f) = 

b − a 

6 

c (2) 4 

1 = 

3 

 

f(a) + 4f( 

 

a + b 

) + f(b) 

2 

Una proprietà che caratterizza la formula di Newton-Cotes, è la seguente: 

i=0 

Per ogni n < 6 

Per n > 7 

i=0 

1 

n 

1 

n 

n 

 

c 

i=0 

(k) 

i 

n 

 

c 

i=0 

(k) 

i 

 

 

= 1 

 

 

> 1 

Studiamo il condizionamento perturbando la f. 

 

 

In(f) − In( ˜ 

 

 

f) = 

h 

n 

fic (n) 

n 

i − h ˜fic (n) 

 

n 

 

i = h (fi − 

 

˜ fi) · c (n) 

 

n 

 

i ≤ h· fi − 

˜ 

 

fi 

· 

Considerando che 

fi 

− ˜ 

 

fi 

≤ f 

− ˜ 

 

f 

otteniamo che 

h · 

n 

 

fi − ˜ 

 

fi 

· 

i=0 

c (n) 

i 

i=0 

 

 

≤ (b − a) · f 

− ˜ 

 

f 

· 1 

n 

n 

 

c 

i=0 

(n) 

i 

 

 

f 

− ˜ 

 

f 

rappresentano i dati in ingresso, quidni i restanti due fattori della 

precedente equazione concorrono in qualche modo a modificare la perturbazione. 

Analiziamo i due casi: 

• Se n ≤ 6 allora 

• Se n ≥ 7 allora 

 

 

(b − a) f 

− ˜ 

 

fi 

 

 

(b − a) · f 

− ˜ 

 

f 

· 1 

n 

n 

 

c 

i=0 

(n) 

i 

Considerando che per n ≥ 7, il fattore 1 n n 

questo algoritmo non conveniete in questo caso. 

6.2 Errore 

 

 

 

 

 

i=0 c (n) 

i 

Definiamo l’errore commesso nell’approssimazione (vedi 5.26) come 

En(f) = I(f) − In(f) = 

b 

a 

f(x) − pn(x)dx = 

106 

b 

a 

 

 

 

i=0 

 

 

≫ 1, si considera 

f[x0, . . .,xn, x]ωn+1(x)dx 

(6.6) 

c (n) 

i

Teorema 33 (Errore quadratura). Se f ∈ C (n+k) ([a, b]) con k = 1 se n è pari, 

k = 2 altrimenti, allora 

n+k+1 

En(f) = νn · f(n+1) 

(ξ) b − a 

· 

n + k n 

con ξ ∈ [a, b] (6.7) 

⎧ n n 

⎪⎨ 

(t − j)dt n dispari 

0 j=0 

ν = n n 

⎪⎩ 

t · (t − j)dt n pari 

(6.8) 

0 

Con questa nuova formula l’errore per la formula dei trapezi è: 

E1(f) = − 1 

12 f(2) (ξ)(b − a) 3 

j=0 

mentre l’errore per la formula di Simpson risulta: 

E2(f) = − 1 

90 f(4) (ξ)(b − a) 5 

(6.9) 

(6.10) 

Il nostro intento è quello di ridurre l’errore, senza aumentare il valore di n più di 

6. Usiamo un approccio del tutto simile a quello utilizzato per ridurre l’errore 

nel calcolo del polinomio interpolante. Infatti le spline sono state introdotte 

proprio per questo. Si tratta quindi di applicare il metodo Newton-Cotes con 

lo stesso valore di n, a pi sottointervalli di [a, b], con un ampiezza minore. 

6.3 Formule composite 

Presentiamo di seguito la formula composita dei trapezi: 

b 

a 

f(x)dx = 

n 

i=1 

xi 

xi−1 

f(x)dx = 

b − a 

n 

n 

i=1 

f(xi−1 + f(xi) 

2 

= b − a 

2n · (f0 + f1 + f1 + f2 + f2 + . . . + . . . + fn−1 + fn−1 + fn) = 

= b − a 

 

 

n−1 

f0 + 2 · fi + fn = 

2n 

b − a 

 

f0 

n 2 + 

n−1 

fi + fn 

 

2 

i=1 

Da notare che adesso n rappresenta il numero degli intervalli in cui è suddiviso 

[a, b]. Dal terorema 33, possiamo ricavare l’errore per la relativa formula 

composita. 

E (n) 

1 (f) = − 1 

12 

= − 1 

12 n· 

 

b − a 

n 

n 

i=1 

3 n 

i=1 

f (2) (ξ)(xi − xi−1) 3 = − 1 

12 

i=1 

= 

n 

f (2) 

b − a 

(ξ) 

n 

i=1 

f (2) (b − a)3 

(ξi) = − 

12n2 f(2) ( ˆ ξi) ≈ o 

107 

3 

= 

3 (b − a) 

n2 

→ 0 per n → ∞

Per la formula di Simpson invece risulta: 

b 

a 

f(x)dx = 

= b − a 

n 

i=1 

3n 

x2i 

x2i−2 

m−1 

 

i=0 

f(x)dx = 

b − a 

3n 

 

m−1 

f2i+1 + 2 

i=1 

m 

i=1 

f2i−2 + 4f2i−1 + f2i = 

f2i + f0 + fn 

Analogamente alla formula di trapezi si dimostra che l’errore per la relativa 

formula compostia di Simpson è: 

E (n) 

2 (f) = − n 

180 f(n) (ξ) 

b − a 

n 

5 

 

= 

→ 0 per n → ∞ (6.11) 

In definitiva, l’errore, sia per la formula dei trapezi, che per quella di Simpson, 

si riduce notevolemtne man mano che il numero di intervalli aumenta. Vediamo 

adesso l’algoritmo per l’approssimazione dell’integrale definito con il metodo dei 

trapezi composito. 

Algoritmo 6.1 (Trapezi composito). 

function integrale=trapezi(f,a,b,n) 

%La funzione trapezi, calcola l’integrale della funzione 

%f, nell’ intervallo [a,b], approssimandolo con la 

%formula composita dei trapezi. 

% 

%INPUT 

% f funzione da integrare 

% a estremo destro dell’intervallo 

% b estremo sinistro dell’intervallo 

% n numero di intervalli 

h=(b-a)/n; 

x=[a:h:b]; 

%y=inline(f); 

%yy=feval(f,x); 

yy=f(x); 

integrale=h*(0.5*yy(1)+sum(yy(2:n))+0.5*yy(n+1)); 

Di seguito l’algoritmo con il metodo di Simpson. 

Algoritmo 6.2 (Simpson composito). 

function integrale=simpson(f,a,b,n) 

%La funzione simpson, calcola l’integrale della funzione 

%f, nell’ intervallo [a,b], approssimandolo con la 

%formula composita di Simpson. 

108

% 

%INPUT 

% f funzione da integrare 

% a estremo destro dell’intervallo 

% b estremo sinistro dell’intervallo 

% n numero di intervalli 

h=(b-a)/n; 

x=[a:h/2:b]; 

y=inline(f); 

yy=feval(f,x); 

integrale=(h./3).*(sum(yy(1:2:n-1))+(2.*sum(yy(2:2:n-1)))+yy(1)+yy(n)); 

6.4 Formule adattive 

Spesso si ha a che fare con funzioni integrande non molto regolari. I metodi 

visti fino ad adesso, risultano poco accurati se la derivata della funzione, assume 

valori elevati e cambia spesso di segno. Per questo vengono introdotti dei 

metodi che riescono ad ottenere una precisione prefissata, laddove serve. Dobbiamo 

stabilire un criterio di arresto, per la tolleranza richiesta. Consideriamo 

allora l’approssimazione con la formula dei trapezi dell’integrale su uno e due 

sottointervalli. L’errore su un intervallo è approssimativamente: 

I(f) − I (1) 1 

1 (f) ≈ − 

12 f(2) (ξ)(b − a) 3 

mentre quello su due sottointervalli risulta 

I(f) − I (2) 1 

1 (f) ≈ − 

12 f(2) (b − a)3 

(ξ) 

4 

Sottraendo membro a membro le due equazioni precedenti otteniamo che 

I (1) 

1 

 

1 (f) − I(2) 1 (f) ≈ I 

3 

(2) 

 

1 (f) − I1(f) 

L’algoritmo quindi opera con il principio divide et impera. Per ogni sottointervallo, 

se la stima dell’errore è maggiore della tolleranza richiesta, si procede a 

dividere il sottointervallo in due parti, e si riapplica l’algoritmo su entrambi i 

sottointervalli. Per questo si parla di formule adattive, perché sono in grado 

di ottenere una tolleranza prefissata, partizionando l’intervallo di integrazione 

in modo tale da ottimizzare le risorse di calcolo. Il caso limite rappresentato 

dall’integrale della funzione costante y = k, con k ∈ R. Infatti la formula adattiva 

si ferma alla prima iterazione, per ogni tolleranza fissata maggiore di zero. 

Presentiamo allora l’algoritmo adattivo che usa il metodo dei trapezi. 

Algoritmo 6.3 (Simpson composito). 

function [int,x]=trapeziAdpt(f,a,b,tol,hmin) 

109

% 

%usage: int=trapezi(f,a,b,tol,hmin) 

%Questa funzione calcola l’integrale della funzione f nell’intervallo [a,b] 

%con una tolleranza tol. 

%hmin la lunghezza pu raggiungere il segmento b-a. 

%E’ possibile che questo metodo non raggiunga la tolleranza prefissata. 

% 

%INPUT 

% f funzione integranda.deve essere una funizone che riceve in ingresso 

% un vettore e restituisce in output un vettore 

% a estremo sinistro dell’intervallo 

% b estremo destro dell’intervallo 

% tol la tolleranza che l’algoritmo dovrebbe rispettare. 

% hmin pi piccola lunghezza dell’intervallo sul quale pu 

% essere calcolato l’integrale 

x=[a,b]; 

if b

%ritorna il vettore [0,1,2,3]. 

a=sort(a); 

n=length(a); 

if(n==1) 

warning(’Il vettore ha solo un elemento,’); 

printf(’quindi non pu contenere duplicati’); 

x=a; 

return 

end 

i=2; 

while in) break; end 

end 

i=i+1; 

if (i>n) break; end 

end 

x=a; 

Esempio 26. Facciamo un esempio usando l’algoritmo dei trapezi adattivo. In 

particolare siamo interessati a vedere come si dispongono le ascisse per l’lagoritmo 

dei trapezi. Lo script per eseguito per generare l’esempio è il seguente: 

f=inline(’rdatan(x)’); 

a=0; 

b=5; 

[int,x]=trapeziAdpt(f,a,b,10^-3,10^-4); 

xx=linspace(a,b,201); 

yy=f(xx); 

hold on 

plot(xx,yy,’k’); 

y=f(x); 

plot(x,y,’ro’); 

Dove la funzione atan è definita come 

function [y]=datan(x) 

y=1./(1+(x.^2)); 

In output viene generato il grafico 6.1, oltre al valore approssimato dell’integrale 

della funzione. Come si può notare, le ascisse sono più dense dove la derivata 

della funzione cambia di segno e il suo valore assoluto è alto. Nella prima parte 

111

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

runge(x)=1/1+x 2 

ascisse di quadratura 

−0.1 

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 

Figura 6.1: Grafico delle ascisse di quadratura 

applicata alla funzione di Runge. 

della funzione infatti si addensano la maggior parte delle ascisse, mentre man 

mano che x cresce occorrono sempre meno ascisse per ottenere la tolleranza 

richiesta. 

112

Esempio 27. Vediamo a quanto ammonta l’errore reale sull’approssimazione 

di un integrale con il metodo dei trapezi composito. Per far questo abbiamo 

bisogno di una funzione facilmente integrabile. La seguente funzione 

1 

1 + x 2 

ha come integrale 

b 

1 

= atan(x)|b 

1 + x2 a = atan(b) − atan(a) 

a 

(6.12) 

Il seguente script, mette in evidenza l’errore esatto tra l’integrale della funzione 

6.12 calcolato nell’intervallo [a, b] e l’integrale in forma analitica. 

imax=8; 

a=0; 

b=5; 

tol=zeros(1,imax); 

tol(1)=10^-1; 

for j=2:imax 

tol(j)=tol(j-1)./10; 

end 

hmin=10^-10; 

f=inline(’datan(x)’); 

i=1; 

printf(’ ------------------------------------------------ \n’); 

printf(’| tol | approssimazioni | errore |\n’); 

printf(’ ------------------------------------------------ \n’); 

temp=atan(b); 

while i

Come ci potevamo aspettare, la tolleranza richiesta rispetta l’errore esatto. 

114

Bibliografia 

[1] Calcolo Numerico 

Prof. Luigi Brugnano 

Prof.ssa Cecilia Magherini 

Prof.ssa Alessandra Sestini 

Master Università & Professioni 

viale Morgagni, 39/r - 50134 Firenze 

tel. 055 4368577 

email masterlibri@libero.it 

[2] IEEE Standard 754 for Binary Floating-Point Arithmetic 

Prof. W. Kahan 

Elect. Eng. & Computer Science 

University of California 

Berkeley CA 94720-1776 

disponibile all’indirizzo web 

http://www.cs.berkeley.edu/~wkahan/ieee754status/IEEE754.PDF 

[3] Floating Point Unit 

Jidan Al-Eryani 


http://www.opencores.org/projects.cgi/web/fpu100/fpu_doc.pdf 

[4] Floating point - IEEE Standard unifies arithmetic model 

Cleve Moler 

chairman and co-founder of The MathWorks. 

moler@mathworks.com 


http://www.mathworks.com/company/newsletters/news_notes/pdf/ 

Fall96Cleve.pdf 

[5] Esercizi svolti di calcolo numerico 

Stefano Berrone 

Sandra Pieraccini 

Edizioni C.L.U.T. 

corso Duca delgi Abruzzi, 24 - 10129 Torino 

tel. 0115647980 

ISBN: 88-7992-183-5 

[6] Matematica Numerica 2 a edizione 

Alfio Quarteroni 

115

Riccardo Sacco 

Fausto Saleri 

ed. Springer-Verlag italia, Milano 

ISBN: 88-470-0077-7 

[7] Algebra Lineare 

Seymour Lipshutz 

ed. Etas Libri 

ISBN: 88-453-0528-7 

116

Calcolo Numerico

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?