Appunti delle Lezioni di Ottimizzazione di Sistemi ... - Iasi.cnr.it - Cnr

Appunti delle Lezioni di Ottimizzazione 

di Sistemi Complessi 

a cura di G. Liuzzi 1 

Master in Ottimizzazione e Data Mining 

1 liuzzi@iasi.cnr.it, http://www.iasi.cnr.it/∼liuzzi

Capitolo 1 

Programmazione Multiobiettivo 

1.1 Introduzione 

Un problema matematico di ottimizzazione può essere definito come la minimizzazione o 

massimizzazione di una funzione a valori reali su un insieme specificato. L’importanza 

di questo modello matematico deriva ovviamente dal fatto che molti problemi reali vengono 

affrontati facendovi ricorso. Tuttavia quasi ogni problema reale di ottimizzazione è 

caratterizzato dalla presenza contemporanea di più obiettivi, cioè funzioni a valori reali da 

massimizzare e/o minimizzare, tipicamente in contrasto tra loro. 

Nel seguito considereremo il seguente problema di ottimizzazione multiobiettivo: 

min (f 1 (x)f 2 (x)...f k (x)) ⊤ 

x ∈ F 

(MOP) 

ove k ≥ 2 e f i : IR n → IR, per i = 1, . . .,k. 

D’ora in avanti chiameremo IR k spazio degli obiettivi e IR n spazio delle variabili di decisione. 

Un vettore x ∈ IR n sarà pertanto un vettore di decisioni mentre z ∈ IR k un vettore di obiettivi. 

Indicheremo, inoltre, con f(x) il vettore delle funzioni obiettivo (f 1 (x)f 2 (x)...f k (x)) ⊤ e con 

Z = f(F) l’immagine della regione ammissibile F nello spazio degli obiettivi (vedi figura) e 

cioè 

Z = f(F) = { z ∈ IR k : ∃x ∈ F, z = f(x) } . 

In particolare diremo che un vettore di obiettivi z ∈ IR k è ammissibile quando risulti z ∈ Z. 

Definiamo , inoltre, il vettore ideale degli obiettivi z id come il vettore di componenti 

Vettore ideale 

z id 

i = min f i (x) 

x ∈ F 

Quello che vogliamo fare è minimizzare tutte le funzioni obiettivo simultaneamente. Se 

non ci fossero conflitti tra le funzioni obiettivo, una soluzione banale al problema sarebbe 

quella ottenibile risolvendo separatamente k problemi di ottimizzazione (uno per ogni funzione 

obiettivo) ottenendo quindi come soluzione proprio il vettore ideale z id . Non sarebbe 

pertanto necessario applicare nessuna tecnica specifica di soluzione. Per evitare il sorgere 

di tale caso banale, supporremo che z id ∉ Z. Questo significa assumere che le funzioni 

f 1 (x), f 2 (x), . . . , f k (x) siano, almeno in parte, in contrasto tra loro. 

Con B(x, δ) = {y ∈ IR n | ‖x − y‖ < δ} indicheremo la sfera aperta di centro x ∈ IR n e raggio 

δ > 0. Dato un insieme A, indicheremo con ∂A la frontiera di A, con ◦ A l’interno e con Ā la 

chiusura di A. 

1

x 2 

z 2 

f 

S 

Z=f(S) 

x 1 

z 1 

x 3 

Dati due insiemi A e B definiamo l’insieme differenza A\B come quell’insieme costituito da 

tutti e soli gli elementi di A che non appartengono a B, ovvero 

A\B = { x ∈ A : x ∉ B } . 

Dato un vettore b ∈ IR n ed un insieme A ⊂ IR n , definiamo traslazione di A rispetto a b 

l’insieme 

b + A = { x ∈ IR n : x = b + a per ogni a ∈ A } . 

In maniera del tutto analoga definiamo l’insieme 

b − A = { x ∈ IR n : x = b − a per ogni a ∈ A } . 

Se I è un insieme di indici e v un vettore, con v I indicheremo il sottovettore costituito dalle 

componenti di v con indici in I. Sia infine IR k + l’ortante positivo dello spazio degli obiettivi 

cioè 

IR k + = { z ∈ IR k : z ≥ 0 } . 

1.2 Ottimalità secondo Pareto 

Prima di procedere, è necessario definire con chiarezza cosa si intende per soluzione ottima 

di un problema di programmazione multiobiettivo. La definizione che adottiamo e 

che è riportata nel seguito, è stata proposta per la prima volta da Edgeworth nel 1881 e 

successivamente ripresa da Vilfredo Pareto nel 1896 [4] che la approfondì ulteriormente. 

Definizione 1.2.1 Dati due vettori z 1 , z 2 ∈ IR k , diciamo che z 1 domina z 2 secondo Pareto 

(z 1 ≤ P z 2 ) quando risulta 

z 1 i ≤ z2 i 

z 1 j < z2 j 

per ogni i = 1, 2, . . ., k e 

per almeno un indice j ∈ {1, . . .,k}. 

La relazione binaria ≤ P è un ordinamento parziale (non riflessivo) nello spazio delle k-uple di 

numeri reali. Sfruttando la relazione ≤ P possiamo dare la definizione di ottimalità secondo 

Pareto. 

Definizione 1.2.2 Un vettore di decisioni x ⋆ ∈ F è un ottimo di Pareto se non esiste 

un’altro vettore x ∈ F tale che: 

Ottimo di Pareto 

f(x) ≤ P f(x ⋆ ). 

2

Ottimi locali 

Ottimi globali 

Figura 1.1: Ottimi locali e globali di Pareto. 

Corrispondentemente diremo che un vettore di obiettivi z ⋆ ∈ Z è ottimo secondo Pareto 

quando non esiste un altro vettore z ∈ Z tale che 

z ≤ P z ⋆ . 

Quindi se ci troviamo in un punto ottimo secondo Pareto e vogliamo ulteriormente diminuire 

il valore di una o più funzioni obiettivo dobbiamo essere disposti ad accettare un conseguente 

aumento in alcune (o tutte) le rimanenti funzioni del problema. In tal senso possiamo 

affermare che, nello spazio degli obiettivi, gli ottimi di Pareto sono punti di equilibrio che si 

trovano sulla frontiera dell’insieme Z. 

Definizione 1.2.3 Diciamo frontiera efficiente l’insieme degli ottimi di Pareto del problema 

(MOP) 

La definizione di ottimo secondo Pareto è ovviamente, una definizione di ottimo globale dato 

che si richiede la validità di una certa proprietà su tutto l’insieme ammissibile del problema 

(MOP). È evidentemente possibile, però, dare una definizione di ottimo locale secondo 

Pareto. 

Definizione 1.2.4 Un vettore di decisioni x ⋆ ∈ F è un ottimo locale di Pareto se esiste un 

numero δ > 0 tale che x ⋆ è ottimo secondo Pareto in F ∩ B(x ⋆ , δ). 

Frontiera 

efficiente 

Ottimo locale 

di Pareto 

In figura 1.1 si riportano gli ottimi globali e locali di Pareto per un insieme Z. 

Ovviamente, ogni ottimo globale è anche un ottimo locale di Pareto. Il viceversa è vero solo 

se facciamo alcune ipotesi sulla struttura del problema (MOP). Se (MOP) è convesso cioè 

se 

i- l’insieme ammissibile F è convesso e 

ii- tutte le funzioni obiettivo f i (x) (con i = 1, 2, . . ., k) sono convesse. 

allora si può dimostrare che ogni ottimo locale di Pareto è anche un ottimo globale. 

Teorema 1.2.5 Sia (MOP) un problema di programmazione multiobiettivo convesso. Allora, 

ogni ottimo locale di Pareto è anche un ottimo globale. 

La definizione di ottimo secondo Pareto può essere leggermente indebolita ottenendo così la 

definizione di ottimo debole secondo Pareto. 

Definizione 1.2.6 Un vettore x ⋆ ∈ F è un ottimo di Pareto debole per il problema (MOP) 

se non esiste un punto x ∈ F tale che 

Equivalenza tra 

ottimi locali e 

globali 

di Pareto 

Ottimalità debole 

secondo Pareto 

f(x) < f(x ⋆ ). 

3

2 

Z 

Ottimi deboli di Pareto 

Ottimi di Pareto 

Z 1 

Figura 1.2: Gli ottimi di Pareto sono individuati dalla linea doppia a tratto continuo. La linea tratteggiata 

individua invece gli ottimi deboli che non sono ottimi di Pareto. 

Ovviamente, l’insieme degli ottimi secondo Pareto è contenuto nell’insieme degli ottimi 

deboli di Pareto. 

Anche qui, come gia si era fatto per gli ottimi di Pareto, è possibile dare una definizione di 

ottimo locale debole. 

Definizione 1.2.7 Un vettore di decisioni x ⋆ ∈ F è un ottimo locale debole (secondo 

Pareto) se esiste un numero δ > 0 tale che x ⋆ è ottimo debole di Pareto in F ∩ B(x ⋆ , δ). 

Ottimo locale 

debole di Pareto 

In figura 1.2 sono riportati, per maggiore chiarezza, ottimi e ottimi deboli secondo Pareto. 

Anche per gli ottimi deboli secondo Pareto vale una proprietà analoga a quelle espressa dal 

teorema 1.2.5 e cioè se il problema (MOP) è convesso ogni ottimo locale (debole) è anche 

ottimo globale (debole) di Pareto. 

1.2.1 Esercizio 

Sia dato il seguente problema di ottimizzazione vettoriale: 

⎧ 

min (x 1 + x 2 , x 1 − x 2 ) ⊤ 

⎪⎨ x 2 1 + x2 2 ≤ 2 

x 2 1 

⎪⎩ 

− x 2 ≤ 0 

x 1 ≥ 0 

(1) 

In questo caso, in cui il vettore delle decisioni ha dimensione due, è semplicissimo tracciare 

la regione ammissibile nello spazio delle variabili di decisione. Inoltre, poiché il vettore degli 

obiettivi ha dimensione due e le funzioni obiettivo sono lineari, possiamo determinare la 

rappresentazione grafica di Z = f(F). Vediamo nel dettaglio come fare. 

Le relazioni che dobbiamo prendere in considerazione sono le seguenti due trasformazioni 

lineari: 

{ 

z1 = f 1 (x 1 , x 2 ) = x 1 + x 2 

z 2 = f 2 (x 1 , x 2 ) = x 1 − x 2 

(2) 

La regione ammissibile degli obiettivi è ottenibile da quella delle decisioni mediante rotazione 

e scalatura, come messo in evidenza dalla figura 1.3 

Sempre per via grafica, è facile risolvere i sottoproblemi ad un solo obiettivo associati al 

4

z 

2 

2 

1 

x2 

2 

f 

-1 

z id 

-2 

1 

Z 

2 3 

Ottimi di Pareto 

z 1 

1 

F 

1 2 

x1 

Figura 1.3: Esempio 

problema (1) che sono: 

z1 id 

⎧ = min x 1 + x 2 

⎪⎨ x 2 1 + x 2 2 ≤ 2 

x 2 1 

⎪⎩ 

− x 2 ≤ 0 

x 1 ≥ 0 

e 

z2 id 

⎧ = min x 1 − x 2 

⎪⎨ x 2 1 + x 2 2 ≤ 2 

x 2 1 

⎪⎩ 

− x 2 ≤ 0 

x 1 ≥ 0 

x 1⋆ = (0, 0) ⊤ 

x 2⋆ = (0, √ 2) ⊤ 

ricavando, in tal modo, il vettore ideale degli obiettivi z id = (0, − √ 2) ⊤ . Notiamo subito che 

non essendo z id contenuto in Z = f(F), il problema vettoriale non è risolvibile semplicemente 

minimizzando separatamente le due funzioni obiettivo. 

È altresì facile individuare, in figura 1.3, la frontiera efficiente secondo Pareto dell’insieme 

Z. Come ci aspettavamo, essendo il problema (1) convesso, tutti gli ottimi locali di Pareto 

sono anche globali. 

1.3 Condizioni di Ottimalità 

Nelle sezioni precedenti abbiamo dato delle definizioni fondamentali della programmazione 

multiobiettivo. In particolare, dato che lo spazio delle k-uple di numeri reali è solo parzialmente 

ordinato, abbiamo dovuto definire cosa si intende per minimo di un vettore di 

funzioni. 

Quello che dobbiamo fare ora, è dare una caratterizzazione analitica dei punti di ottimo 

secondo Pareto. Come vedremo, tutte le condizioni di ottimo per la programmazione multiobiettivo, 

comprendono come caso particolare quelle per la programmazione nonlineare (con 

una sola funzione obiettivo). Per ulteriori approfondimenti sull’argomento di questa sezione 

si rimanda al testo [1] citato in bibliografia. 

5

Nel seguito consideriamo un problema in cui F è definito da vincoli di disuguaglianza; cioè: 

min f(x) 

g(x) ≤ 0 

(P) 

ove f : IR n → IR k (k ≥ 2) e g : IR n → IR m sono funzioni continuamente differenziabili ed F 

assume la seguente struttura: 

F = {x ∈ IR n : g(x) ≤ 0}. 

Indichiamo con 

I 0 (x) = {i : g i (x) = 0} 

l’insieme degli indici dei vincoli attivi nel punto x. Sia, inoltre, L : IR n×k×m → IR così 

definita 

L(x, λ, µ) = λ ⊤ f(x) + µ ⊤ g(x), 

la funzione Lagrangiana associata al problema (P). 

1.3.1 Condizioni di Fritz-John 

Una prima condizione necessaria di ottimo per il problema multiobiettivo (P) è data dal 

seguente teorema. 

Teorema 1.3.1 Condizione necessaria affinché ¯x ∈ F sia ottimo secondo Pareto è che 

esistano dei vettori λ ∈ IR k e µ ∈ IR m tali che sia soddisfatto il seguente sistema: 

CN di Fritz-John 

k∑ 

m∑ 

λ i ∇f i (¯x) + µ j ∇g j (¯x) = 0 (3a) 

i=1 

j=1 

µ ⊤ g(¯x) = 0, (3b) 

(λ, µ) ≥ 0, (λ, µ) ≠ (0, 0) 

(3c) 

Esempio di punto che soddisfa le condizioni 

necessarie di ottimalità. 

Esempio di punto che NON soddisfa le condizioni 

necessarie di ottimalità. 

Corollario 1.3.2 Le condizioni del teorema 1.3.1 sono necessarie anche per l’ottimalità 

debole (secondo Pareto) di un punto ¯x. 

✷ 

6

Definizione 1.3.3 (tripla di FJ) Una tripla (x, λ, µ) ∈ IR n×k×m è una tripla di Fritz- 

John quando soddisfa il sistema (3) cioè: 

∇ x L(x, λ, µ) = 0 

g(x) ≤ 0 

µ ⊤ g(x) = 0 

(λ, µ) ≥ 0 (λ, µ) ≠ (0, 0). 

Definizione 1.3.4 (punto di FJ) Un vettore di decisioni x ∈ IR n è un punto di FJ se 

esistono dei vettori λ ∈ IR k e µ ∈ IR m tali che (x, λ, µ) è una tripla di FJ. 

1.3.2 Condizioni di Karush-Kuhn-Tucker 

Si pu`facilmente far vedere che esistono casi in cui un punto ammissibile potrebbe essere un 

punto di FJ indipendentemente dalle funzioni obiettivo. Motivati da questa considerazione 

introduciamo in questo paragrafo le condizioni di KKT con le quali in pratica forziamo i 

gradienti di alcune funzioni obiettivo ad avere un peso non nullo nell’espressione (3a). 

Preliminarmente introduciamo la seguente definizione. 

Definizione 1.3.5 Un punto ammissibile x ∈ F è un punto di regolarità per i vincoli del 

problema (P) se in x sono linearmente indipendenti i gradienti dei vincoli attivi. 

LICQ 

A questo punto possiamo dare la seguente ulteriore condizione necessaria di ottimalità 

secondo Pareto. 

Teorema 1.3.6 Sia ¯x un punto ammissibile per il problema (P) e siano linearmente indipendenti 

i gradienti dei vincoli attivi in ¯x. Allora, condizione necessaria affinché ¯x sia un 

ottimo di Pareto (locale o globale) è che sia ammissibile il seguente sistema: 

CN di KKT 

k∑ 

m∑ 

λ i ∇f i (¯x) + µ j ∇g j (¯x) = 0, (4a) 

i=1 

j=1 

µ ⊤ g(¯x) = 0, (4b) 

(λ, µ) ≥ 0, λ ≠ 0. (4c) 

Corollario 1.3.7 Le condizioni del teorema 1.3.6 sono necessarie anche per l’ottimalità 

debole (secondo Pareto) di un punto ¯x. 

✷ 

Le condizioni di KKT (come quelle di FJ) sono condizioni solo necessarie di ottimo il che 

vuol dire che potrebbero essere verificate anche in punti non ottimi secondo Pareto. È 

tuttavia possibile dare condizioni sufficienti di ottimalità, senza ricorrere all’uso delle derivate 

seconde, a patto però di fare alcune ipotesi aggiuntive sulla struttura del problema (P). 

Teorema 1.3.8 Siano le f i (x) (per ogni i = 1, 2, . . ., k) e g j (x) (per ogni j = 1, 2, . . .,m) 

convesse. Condizione sufficiente affinché un punto ¯x ∈ F sia ottimo secondo Pareto è che 

esistano dei vettori di moltiplicatori λ ∈ IR k e µ ∈ IR m tali che 

CS di ottimo 

secondo Pareto 

∇ x L(¯x, λ, µ) = 0, 

(5a) 

µ ⊤ g(¯x) = 0, (5b) 

λ > 0, µ ≥ 0. 

(5c) 

7

Si noti che nelle condizioni sufficienti di KKT appena viste si richiede che tutti i moltiplicatori 

delle funzioni obiettivo siano strettamente positivi mentre nelle condizioni necessarie almeno 

un λ i è strettamente positivo. 

Per quanto riguarda i punti di ottimo debole secondo Pareto, è possibile stabilire, sempre 

sotto le ipotesi di convessità, un risultato ancora più forte. Per tali punti si possono dare 

condizioni necessarie e sufficienti di ottimo. 

Teorema 1.3.9 Siano le f i (x) (per ogni i = 1, 2, . . ., k) e g j (x) (per ogni j = 1, 2, . . .,m) 

convesse. Condizione necessaria e sufficiente affinché un punto ¯x ∈ F sia ottimo debole 

secondo Pareto è che esistano dei moltiplicatori λ ∈ IR k e µ ∈ IR m tali che 

CNS di KKT 

∇ x L(¯x, λ, µ) = 0, 

µ ⊤ g(¯x) = 0, 

(λ, µ) ≥ 0, λ ≠ 0. 

1.4 Metodi di Soluzione 

Generare le soluzioni ottime secondo Pareto costituisce una parte essenziale della programmazione 

vettoriale ed anzi, matematicamente parlando, nella maggior parte dei casi, il problema 

(P) si considera risolto una volta che sia stato individuato l’insieme degli ottimi di 

Pareto. Tuttavia, non sempre ci si può accontentare semplicemente di aver trovato l’insieme 

degli ottimi secondo Pareto. Alcune volte è infatti necessario ordinare tutte le soluzioni 

trovate e quindi selezionare la migliore rispetto a tale ordinamento. Per questo motivo abbiamo 

bisogno di un decisore cioè di qualcuno che ci dica, in base alle sue preferenze, come 

ordinare l’insieme degli ottimi di Pareto del problema (P). 

In base al ruolo svolto dal decisore nella strategia di soluzione del problema, i metodi 

risolutivi della programmazione multiobiettivo vengono spesso suddivisi in quattro grandi 

categorie. 

• Metodi senza preferenze nei quali il decisore non ha nessun ruolo e si considera soddisfacente 

l’aver trovato un qualunque ottimo di Pareto. 

• Metodi a posteriori nei quali si genera l’insieme di tutti gli ottimi di Pareto e poi lo si 

presenta al decisore che sceglie la soluzione per lui migliore. 

• Metodi a priori nei quali il decisore specifica le sue preferenze prima che abbia inizio 

il processo risolutivo. In base alle informazioni avute dal decisore viene direttamente 

trovata la soluzione ottima migliore, senza dover dunque generare tutti gli ottimi di 

Pareto. 

• Metodi interattivi nei quali il decisore specifica le sue preferenze mano a mano che 

l’algoritmo procede, guidando in tal modo il processo risolutivo verso la soluzione per 

lui più soddisfacente. 

Al di là di questa distinzione, tutti i metodi di soluzione per la programmazione multiobiettivo 

si basano sulla medesima idea di fondo, ovvero quella di trasformare il problema 

originario in uno con una sola funzione obiettivo. La tecnica mediante la quale si ottiene il 

problema mono obiettivo a partire dal problema (P) è nota come scalarizzazione. 

1.4.1 Metodi Senza Preferenze 

Nei metodi senza preferenze ci si accontenta di generare una soluzione ottima di Pareto, 

qualunque essa sia, senza tenere in considerazione le indicazioni del decisore. 

8

Il metodo che presentiamo è noto come metodo GOAL (cfr. [3, sez. 2.1]). Quello che 

si fa è cercare la soluzione che minimizza, nello spazio degli obiettivi, la distanza tra la 

regione ammissibile (Z) e un qualunque punto di riferimento z ref ∉ Z = f(F). Il vettore 

di riferimento sarà costituito dai valori auspicabili per le singole funzioni obiettivo. In 

particolare, una possibile scelta di z ref è z ref = z id . Il problema che otteniamo è perciò il 

seguente: 

min ‖f(x) − z id ‖ p 

g(x) ≤ 0 

ove ‖ · ‖ p indica la norma p di un vettore (con 1 ≤ p ≤ ∞). In particolare, se p = ∞, il 

problema (P p) è noto come problema di Tchebycheff. Supponiamo di conoscere il vettore 

ideale globale degli obiettivi. Sotto tali ipotesi, il problema (P p) ammette sempre soluzione. 

Valgono le seguenti proprietà. 

Proposizione 1.4.1 Ogni soluzione globale del problema (P p) (con 1 ≤ p < ∞) è un ottimo 

globale di Pareto per il problema (P). 

Estendiamo ora il risultato precedente al caso dei minimi locali (cfr. [3]). 

Proposizione 1.4.2 Ogni ottimo locale del problema (P p) (con 1 ≤ p < ∞) è un ottimo 

locale di Pareto per il problema (P). 

✷ 

Nel caso in cui p = ∞ vale invece la seguente proprietà (cfr. [3]). 

Proposizione 1.4.3 Ogni ottimo locale (globale) del problema di Tchebycheff (P ∞ ) è un 

ottimo locale (globale) debole di Pareto del problema (P). 

✷ 

Tuttavia, la seguente proposizione, ci assicura l’esistenza di almeno una soluzione di (P ∞ ) 

ottima secondo Pareto per il problema (P). 

Proposizione 1.4.4 Il problema di Tchebycheff (P ∞ ) ha almeno una soluzione che è ottima 

secondo Pareto. 

✷ 

Le scelte di p = 1 e p = ∞ sono particolarmente vantaggiose nel caso in cui il problema 

multiobiettivo originario è lineare (f i (x), g j (x) lineari per ogni i e j). Mediante semplici 

manipolazioni sul problema (P p) è infatti possibile ottenere ancora un problema lineare e 

quindi adottare le ben note tecniche della PL per la sua soluzione. Supponiamo che (P) sia 

lineare ovvero 

min (c ⊤ 1 x, c ⊤ 2 x, . . . , c ⊤ k x) 

Ax ≤ b 

• Norma p = 1. 

Il problema scalarizzato 

min 

k∑ 

i=1 

|c ⊤ i x − z id 

i | 

Ax ≤ b 

può essere facilmente trasformato in un problema di PL con l’aggiunta di k variabili ausiliarie, 

α i per i = 1, 2, . . ., k, ottenendo: 

min 

k∑ 

α i 

{ i=1 

|c 

⊤ 

i x − zi id| 

≤ α i 

Ax ≤ b 

i = 1, 2, . . ., k 

(P p) 

9

x 2 

2 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 F 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

0000000000000000 

1111111111111111 

1 

2 

0000000000000000 

1111111111111111 

1 

x 

1 

Figura 1.4: Regione ammissibile 

• Norma p = ∞. 

In questo caso, il problema scalarizzato 

min 

max 

i=1,...,k {|c⊤ i x − zi id |} 

Ax ≤ b 

può essere facilmente trasformato in un problema di PL con l’aggiunta di una sola variabile 

ausiliaria, α, ottenendo: 

min α { 

|c 

⊤ 

i x − zi id| 

≤ α 

Ax ≤ b 

i = 1, 2, . . ., k 

Esempio 

Si consideri il seguente problema di programmazione multiobiettivo: 

min 

⎧ 

(x 1 , x 2 ) 

⎪⎨ x 2 1 + x 2 2 ≥ 1 

0 ≤ x 1 ≤ 2 

⎪⎩ 0 ≤ x 2 ≤ 2 

(P es) 

In questo esempio, vedi figura 1.4, le regioni ammissibili nello spazio delle variabili di 

decisione ed in quello degli obiettivi coincidono essendo 

{ 

z1 = x 1 

z 2 = x 2 

Possiamo inoltre facilmente calcolare il vettore ideale degli obiettivi ottenendo così: z id = 

(0, 0) ⊤ . In figura 1.5a sono riportati gli ottimi di Pareto del problema (P es). 

A questo punto applichiamo il metodo GOAL con p = 1, 2, ∞. 

10

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

(a) 

(b) 

(c) 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

0000000 

1111111 

(d) 

Figura 1.5: Differenti soluzioni in corrispondenza a differenti tipi di norme. 

• p = 1. Il problema scalarizzato con questo tipo di norma ha due soluzioni (vedi figura 

1.5b). 

• p = 2. Il problema che otteniamo usando la norma euclidea ha infinite soluzioni (come 

si vede in figura 1.5c) e cioè tutte le soluzioni del problema (P es). 

• p = ∞. Il problema di Tchebycheff ha una sola soluzione (vedi figura 1.5d) 

1.4.2 Metodi a Posteriori 

I metodi appartenenti a questa classe sono anche noti come metodi per generare l’insieme 

delle soluzioni di Pareto. Infatti, siccome le preferenze del decisore vengono considerate 

solo al termine del processo risolutivo, quello che si fa è generare tutti i punti ottimi secondo 

Pareto. Una volta che l’insieme delle soluzioni di Pareto è stato generato, esso viene 

presentato al decisore che seleziona il o i vettori per lui migliori. 

L’inconveniente principale di questa strategia sta nel fatto che il processo di generazione degli 

ottimi di Pareto è, molto spesso, computazionalmente oneroso. Inoltre, potrebbe non essere 

semplice, per il decisore, scegliere una soluzione tra gli ottimi che gli vengono presentati, in 

special modo se questi sono numerosi. Per questo motivo, è molto importante il modo con 

il quale le soluzioni vengono presentate al decisore. 

Metodo dei Pesi (cfr. [3, sez. 3.1]) 

Consideriamo il seguente problema 

min 

k∑ 

w i f i (x) 

i=1 

g(x) ≤ 0 

(P w) 

11

ove w ∈ IR k + e i coefficienti w i si intendono normalizzati cioè tali che 

k∑ 

w i = 1. 

i=1 

Esiste una relazione tra le soluzioni di (P w) e i punti di Pareto di (P). 

proposizione mette in evidenza proprio questa relazione (cfr. [3]). 

La seguente 

Proposizione 1.4.5 Ogni soluzione locale (globale) del problema (P w) è un ottimo debole 

locale (globale) di Pareto per il problema (P). 

✷ 

Nel caso in cui il problema (P w) ammette una unica soluzione allora si può stabilire un 

risultato un po’ più forte del precedente (cfr. [3]). 

Proposizione 1.4.6 Se il problema (P w), fissato il vettore dei pesi w ≥ 0, ammette una 

unica soluzione allora essa è un ottimo di Pareto per il problema (P). 

Allo stesso modo, se i pesi w i sono tutti strettamente positivi è possibile dimostrare la 

seguente 

Proposizione 1.4.7 Se w i > 0 per ogni indice i, ogni soluzione locale (globale) del problema 

(P w) è un ottimo locale (globale) di Pareto per il problema (P). ✷ 

Nell’ipotesi in cui il problema multiobiettivo (P) è convesso, è possibile stabilire la seguente 

proprietà di esistenza (cfr. [3]) 

Proposizione 1.4.8 Sia x ⋆ un ottimo di Pareto per il problema (P). Se (P) è convesso 

allora esistono dei pesi w ∈ IR k + con 

k∑ 

w i = 1 

i=1 

e tali che x ⋆ è soluzione anche del problema (P w). 

✷ 

Metodo degli ε-vincoli (cfr. [3, sez. 3.2]) 

Si seleziona una funzione obiettivo f l (x) tra gli obiettivi di (P) e poi si trasformano tutte le 

altre funzioni f i (x) (con i = 1, 2, . . ., k i ≠ l) in vincoli, imponendo degli upper bound sui 

loro valori. Il problema che otteniamo è allora il seguente: 

min f l (x) 

f i (x) ≤ ε i 

g(x) ≤ 0 

∀i = 1, 2, . . ., k i ≠ l 

(P ε) 

ove l ∈ {1, 2, . . ., k}. 

Proposizione 1.4.9 (cfr. [3]) Ogni soluzione di (P ε) è un ottimo debole secondo Pareto 

per il problema (P). 

✷ 

La prossima proposizione fornisce condizioni necessarie e sufficienti di ottimalità (secondo 

Pareto) per il problema (P) delle soluzioni di (P ε). 

Proposizione 1.4.10 Un vettore x ⋆ ∈ F è ottimo secondo Pareto di (P) se e solo se è 

soluzione di (P ε) per ogni scelta di l ∈ {1, 2, . . ., k} ed essendo ε i = f i (x ⋆ ) con i ≠ l. 

Proposizione 1.4.11 (cfr. [3]) Se il punto x ⋆ ∈ F è l’unica soluzione del problema (P ε) 

per qualche l ∈ {1, 2, . . ., k} e con ε j = f j (x ⋆ ) per ogni j ≠ l allora esso è Pareto ottimo per 

il problema (P). 

✷ 

12

Capitolo 2 

Programmazione con Incertezza 

2.1 Nozioni preliminari 

È noto che un generico problema di ottimizzazione può essere posto nella forma [2] 

min x 

f ◦ (x) 

c.v. x ∈ D, 

ove x ∈ IR n è detto vettore delle variabili di decisione, f : IR n → IR è detta funzione obiettivo 

e D ⊆ IR n è detto insieme ammissibile. A seconda delle proprietà della funzione f ◦ (x) e 

dell’insieme D parleremo di ottimizzazione lineare o non lineare, ottimizzazione vincolata o 

non vincolata, ottimizzazione continua o combinatoria e così via. 

Per quanto concerne queste note è comodo introdurre la seguente funzione obiettivo estesa 

f : IR n → IR ¯ tale che 

{ 

f◦ (x) se x ∈ D, 

f(x) = 

+∞ se x ∉ D, 

per cui è possibile riscrivere il generico problema di ottimizzazione come 

min f(x). 

x 

Dato uno spazio di probabilità (Ω, F, P), sia ω : (Ω, F) → (IR n , B n ) una v.a. e supponiamo 

che la funzione obiettivo f ◦ (x, ω) e l’insieme ammissibile D(ω) dipendano dalle realizzazioni 

di ω. Anche in questo caso possiamo pensare alla funzione obiettivo estesa definita come 

{ 

f◦ (x, ω) se x ∈ D(ω), 

f(x, ω) = 

+∞ se x ∉ D(ω). 

Nel caso attuale, in cui i dati del problema dipendono esplicitamente dalla v.a. ω, non è più 

immediato riconoscere un problema di ottimizzazione nel senso che non è ben chiaro cosa 

dobbiamo ottimizzare e con quali vincoli dato che sia la funzione obiettivo che la regione 

ammissibile dipendono da un elemento incerto ovvero dalle realizzazioni della v.a. ω. In 

altri termini, non ha certamente senso considerare il problema 

min 

x 

f(x, ω) (1) 

13

2.1.1 Formulazione deterministica 

Ci sono diversi modi di trattare l’incertezza in un problema di ottimizzazione. Un primo 

modo consiste nello stimare un valore della v.a. (come per esempio il suo valore atteso 

IE ω [ω]), sia esso ¯ω, e quindi risolvere il problema 

min 

x 

f(x, ¯ω) (2) 

In questo caso, la funzione obiettivo f(x, ¯ω) non dipende più dalla v.a. ω che è fissata 

al valore ¯ω e quindi il problema è nuovamente un problema, per così dire, deterministico 

che può essere risolto come usualmente si farebbe. Questo approccio, benchè perfettamente 

giustificabile in alcuni ambiti applicativi, potrebbe non avere molto senso e, a volte, portare 

a soluzioni certamente non ottime come vedremo più avanti con alcuni esempi. 

2.1.2 Osservazione e ottimizzazione 

In alcuni casi è possibile posticipare la scelta delle variabili di decisione x ad un momento 

successivo alla osservazione della v.a. ω il che corrisponde a quella che viene comunemente 

definita strategia wait-and-see. In questo caso, ci troviamo a dover risolvere un problema di 

ottimizzazione in x che dipende da ω come parametro. Potremmo così pensare di risolvere 

il problema (2) solo per il valore ˆω corrispondente alla realizzazione della v.a. oppure 

potremmo concentraci sulla determinazione del valore ottimo 

ψ(ω) = inf f(x, ω) 

x 

e dell’insieme di soluzioni ottime 

Ψ(ω) = argmin f(x, ω), 

x 

entrambi funzione della variabile aleatoria ω. 

2.1.3 Ottimizzazione e osservazione 

Contrariamente al caso precedente, potrebbe non essere possibile posticipare la scelta di x 

fin dopo aver osservato la realizzazione della v.a. ovvero è necessario adottare quella che 

comunemente viene definita strategia here-and-now. In questo assetto le decisione vanno 

prese subito avendo a disposizione solo la conoscenza sulla v.a. ω che ci viene dalla sua 

f.d. In questo caso è necessario riflettere sul fatto che per ogni scelta delle variabili x non 

abbiamo un valore certo f(x) ma, piuttosto, un valore incerto f(x, ω). In altri termini, per 

ogni realizzazione della v.a. ω abbiamo una funzione ω ↦→ f(x, ω) ovvero, potremmo pensare 

ad f(x, ω) come ad una v.a. composta. 

Il caso peggiore 

In questo assetto possiamo pensare di risolvere il problema min x ˜f(x) dove 

˜f(x) = sup f(x, ω). 

ω 

Ovviamente, questo significa concentrarsi esclusivamente sul peggiore risultato ottenibile 

avendo fissato le variabili x senza alcun tentativo di distinguere le realizzazioni della v.a. in 

base alla sua distribuzione di probabilità. 

14

Programmazione stocastica 

Questo approccio consiste nell’interpretare, per ogni x, f(x, ω) a sua volta come una v.a. 

che eredita la sua f.d. da quella della v.a. ω. È dunque possibile, per ogni x, calcolare il 

valore atteso ˆf(x) = IE ω [f(x, ω)] e quindi risolvere il problema 

min ˆf(x). (3) 

x 

2.1.4 Esempio: il problema del venditore di giornali 

Questo problema, meglio noto con il nome di newsvendor problem, è probabilmente il più 

semplice esempio di ottimizzazione in presenza di incertezza ed è, pertanto, particolarmente 

adatto per familiarizzare con alucni fondamentali concetti della programmazione in presenza 

di incertezza. Il problema è il seguente. 

Il ragazzo che vende i giornali al semaforo deve decidere quanti giornali x acquistare alle 

prime luci dell’alba dall’editore al costo di c euro per giornale. Durante la mattinata potrà 

rivendere i giornali al prezzo di s euro l’uno e, a fine mattinata, può rivendere all’editore i 

giornali non venduti ricavando r euro l’uno. Ovviamente vale la seguente relazione 

0 ≤ r < c < s. 

Il grosso problema del venditore è che, al momento in cui deve scegliere quanti giornali (x) 

acquistare dall’editore, non conosce con esattezza il numero di clienti che acquisteranno il 

giornale da lui al semaforo. In altri termini, la sua domanda giornaliera di quotidiani può 

essere considerata come una variabile aleatoria la cui realizzazione accadrà in un momento 

successivo a quello in cui deve acquistare i giornali dall’editore. 

Indichiamo con D la v.a. che descrive il numero di giornali effettivamente venduti al semaforo 

durante la mattinata. La tabella che segue riporta i costi, i ricavi e il profitto del venditore 

nella mattinata in funzione della variabile di decisione x e della v.a. D. 

Costi 

acquisto giornali: cx 

Ricavi 

{ 

sx se x < D 

vendite al semaforo: 

sD se x ≥ D 

{ 

0 se x < D 

vendite all’editore: 

r(x − D) se x ≥ D 

profitto: −f(x, D) = −cx + s min{x, D} + r max{0, x − D} 

Il problema da risolvere sarebbe dunque il seguente 

min 

x≥0 

f(x, D), 

e cioè un problema della forma di (1) in cui la v.a. ω = D. 

Supponiamo ora che il venditore possa decidere quanti giornali acquistare dall’editore dopo 

aver avuto notizia di quanti giornali potrà vendere nella mattinata. Siamo nel caso waitand-see 

(cfr. sottosezione 2.1.2) in cui la v.a. D è trattata come un parametro. In questo 

caso la f(x, D) è funzione della sola variabile x e dipende parametricamente da D. 

f(x, D) 

D 

x 

15

Ovviamente, la soluzione ottima risulta essere x = D e il valore ottimo (c − s)D ovvero, 

coerentemente con la notazione fin qui adottata, 

e 

ψ(D) = (c − s)D, 

Ψ(D) = {x ∈ IR : x = D}. 

Ovviamente, questa tecnica risolutiva ha senso solo quando è lecito supporre che ci sia una 

sorta di oracolo che predice al venditore il numero di giornali che potrà vendere al semaforo. 

In ogni altro caso, questa tecnica risolutiva non ha molto senso. 

Supponiamo ora che D sia una v.a. discreta cioè abbia la seguente f.d. di probabilità 

evento F D (·) 

D = 30 1/7 

D = 40 2/7 

D = 50 2/7 

D = 60 1/7 

D = 100 1/7 

Un altro modo di approcciare il problema consiste, come accennato nella sottosezione 2.1.1, 

nel risolvere un problema in cui si fissa il valore della v.a., per esempio, al suo valore atteso 

IE[D] = ¯D = 370/7 e quindi risolvere il problema per D = ¯D. In questo caso la soluzione è, 

banalmente, Ψ( ¯D) cioè x = ¯D, y 1 = ¯D e y 2 = 0 con valore ottimo ψ( ¯D) = (c − s) ¯D. 

Come visto nella sottosezione 2.1.3, un ulteriore modo di procedere è quello di risolvere il 

problema 

min 

x≥0 

max 

30≤D≤100 

f(x, D). 

Considerato il fatto che la funzione f(x, D) è in questo caso non crescente rispetto alla 

variabile D, 

f(x, D) 

x 

D 

risulta max 30≤D≤100 f(x, D) = f(x, ˆD), con ˆD = 30. D’altra parte, siccome, come si verifica 

facilmente, la funzione f(x, 30) 

f(x, 30) 

30 

x 

16

è decrescente per 0 ≤ x ≤ 30 e crescente per x ≥ 30, il problema min x≥0 f(x, 30) ha soluzione 

ottima ¯x = ˆD = 30 con valore ottimo (c − s)¯x = 30(c − s). Questa soluzione corrisponde 

perfettamente all’atteggiamento del venditore che, cautamente, sceglie di acquistare il maggior 

numero di giornali nell’ipotesi di venderne il minor numero possibile. I limiti di questo 

approccio sono evidenti. Nel caso, per esempio, in cui sia possibile anche l’evento D = 0 

la strategia che dovremmo adottare sarebbe x = 0 ovvero il venditore non acquista alcun 

giornale per limitare i danni nel caso peggiore in cui gli dovesse capitare di non venderne 

nessuno. 

Per concludere la rassegna dei vari approcci al problema rimane da analizzare quello detto 

di stochastic programming (programmazione stocastica). Secondo quanto visto nella sottosezione 

2.1.3, questo tipo di approccio consiste nel considerare, per ogni valore x ammissibile, 

la f(x, D) come una nuova v.a. per la quale è possibile calcolare il valore atteso 

IE D [f(x, D)] e quindi risolvere il problema 

min IE D[f(x, D)]. (4) 

x≥0 

Nel caso in esame, in cui D è una v.a. discreta, la funzione che otteniamo è 

f(x) = IE D [f(x, D)] = 1 7 f(x, 30) + 2 7 f(x, 40) + 2 7 f(x, 50) + 1 7 f(x, 60) + 1 f(x, 100) 

7 

che è una funzione convessa, lineare a tratti e continua ma non differenziabile. Sia ∂f(x) il 

subdifferenziale di f in x così definito: 

∂f(x) = {t ∈ IR : f(y) ≥ f(x) + t(y − x) per ogni y ∈ IR}. 

Per la funzione f(x) risulta 

⎧ 

(c − s) se x < 30 

1 

7 

⎪⎨ 

(c − r) + 6 7 

(c − s) se 30 ≤ x < 40 

3 

7 

∂f(x) ∋ 

(c − r) + 4 7 

(c − s) se 40 ≤ x < 50 

5 

7 (c − r) + 2 7 

(c − s) se 50 ≤ x < 60 

6 

7 

⎪⎩ 

(c − r) + 1 7 

(c − s) se 60 ≤ x < 100 

(c − r) se x ≥ 100 

ovvero, più sinteticamente, 

∂f(x) ∋ (c − r)P[D ≤ x] + (c − s)P[D > x] 

= (c − r)F D (x) + (c − s)(1 − F D (x)) 

= (c − s) + (s − r)F D (x). 

Come è noto, considerata la convessità di f(x), x ⋆ è un punto di minimo di f(x) se e solo se 

0 ∈ ∂f(x ⋆ ). 

Nel caso in esame in cui f(x) è funzione di una sola variabile e ∂f(x) ∋ c − s < 0, per ogni 

x < 30 , è possibile determinare il punto di minimo di f(x) cercando il più piccolo x ⋆ ∈ IR 

tale per cui 

∂f(x ⋆ ) ∋ (c − s) + (s − r)F D (x ⋆ ) > 0, 

da cui otteniamo 

x ⋆ = F −1 

D 

( s − c 

s − r 

) 

17

avendo indicato con F −1 

D (α) = min{x : F D(x) ≥ α} ovvero l’α-quantile della distribuzione 

di probabilità F D (ω). Notiamo che x ⋆ corrisponde al punto in cui la pendenza di f(x) passa 

da negativa (f(x) decrescente) a positiva (f(x) crescente). 

La figura che segue riporta l’andamento della funzione f(x), quando r = 0.8, c = 1.6 e 

s = 1.8, da cui è facile riconoscere che il valore ottimo del problema (4) è 

x ⋆ = F −1 

D 

(0.2) = 40. 

x 

IED[f(x, D)] 

30 40 50 60 100 

Supponiamo ora che D sia una v.a. continua, cioè una v.a. con f.d. F D (ω) continua, per 

cui risulta 

f(x) = IE[f(x, D)] = 

∫ ∞ 

0 

f(x, ω)dF D (ω). 

Notiamo che, anche in questo caso, essendo la funzione f(x, D) convessa (e lineare a tratti 

rispetto ad x), anche la funzione f(x) è convessa rispetto ad x. Allora 

f(x) = cx + 

∫ x 

0 

[−rx − (s − r)ω]dF D (ω) − sx 

da cui, mediante integrazione per parti, otteniamo 

f(x) = (c − s)x + (s − r) 

∫ x 

0 

F D (ω)dω. 

∫ ∞ 

x 

dF D (ω), 

Derivando rispetto a x, otteniamo, come nel caso precedente, 

f ′ (x) = (c − s) + (s − r)F D (x). 

Percui, ricordando che f(x) è convessa rispetto a x, x ⋆ è punto di minimo se e solo se 

f ′ (x ⋆ ) = (c − s) + (s − r)F D (x ⋆ ) = 0, 

da cui, anche in questo caso, otteniamo 

F D (x ⋆ ) = s − c 

s − r 

e quindi, nuovamente, 

( ) s − c 

x ⋆ = F −1 

D 

. 

s − r 

18

2.2 Fondamenti di Programmazione Stocastica 

Come gia in parte anticipato nel corso della precedente sezione, le principali caratteristiche 

della programmazione stocastica sono le seguenti: 

1. here-and-now, vale a dire che, non ostante l’ingente coinvolgimento di accadimenti 

futuri, ogni cosa è mirata al miglioramento di decisioni che devono essere prese nel 

presente ovvero prima che qualunque v.a. possa realizzarsi; 

2. ricorsione, ovvero l’opportunità che è data al modellista di tenere conto del fatto 

che le decisioni prese nel presente possano essere, almeno in parte, corrette in tempi 

successivi; 

3. informazione e osservazione, le decisioni in tempi successivi possono rispondere a informazioni 

che si sono rese disponibili da quando sono state prese le decisioni iniziali. 

Questa informazioni è modellata mediante l’osservazione di v.a.; 

4. convessità, teoria e metodi risolutivi di programmazione stocastica sono sviluppati 

sotto l’ipotesi restrittiva di convessità; 

5. indipendenza delle misure di probabilità dalle decisioni, si assume cioè che le v.a. siano 

indipendenti dalle decisioni. 

Uno degli aspetti più caratteristici della programmazione stocastica ed anche quello che maggiormente 

la differenzia dalla programmazione matematica è certamente quello dinamico. 

Più precisamente, in un contesto di programmazione stocastica è opportuno familiarizzare 

con il così detto processo ricorsivo nel quale le decisioni si alternano con le osservazioni. In 

particolare possiamo pensare al seguente processo ricorsivo 

u 0 ∈ IR n0 

ω 1 ∈ Ω 1 

u 1 ∈ IR n1 

ω 2 ∈ Ω 2 

u 2 ∈ IR n2 

. 

ω N ∈ Ω N 

u N ∈ IR nN 

decisione iniziale 

osservazione 

decisione di ricorsione 

osservazione 


osservazione 


In questo processo ricorsivo, abbiamo uno stadio iniziale nel quale viene presa la decisione 

u 0 ∈ IR n0 e successivamente N stadi di ricorsione ciascuno composto da una osservazione, 

nella quale una v.a. si realizza, e da una decisione, che dovrebbe essere la risposta all’osservazione 

appena avvenuta. Alla fine di questo processo ricorsivo, avremo un vettore di 

decisioni 

u = (u 0 , u 1 , . . . , u N ) ∈ IR n 

con n = n 0 + n 1 + · · · + n N 

e un vettore di osservazioni che potremmo definire la storia delle osservazioni e rappresentare 

come 

ω = (ω 1 , . . .,ω N ) ∈ Ω con Ω = Ω 1 × · · · × Ω N . 

Un altro ingrediente essenziale è il costo del processo ricorsivo che può essere pensato come 

una funzione f : IR n × Ω → IR ¯ con 

f(u, ω) = f(u 0 , u 1 , . . . , u N , ω 1 , . . . , ω N ). 

19

Naturalmente la funzione f(u, ω) ha valori nello spazio esteso dei reali ovvero può assumere 

anche il valore +∞. Più precisamente, f(u, ω) = +∞ quando u ∉ C(ω). 

A questo punto, potremmo pensare che lo scopo dell’ottimizzatore sia quello di risolvere il 

seguente problema 

min IE ω [f(u, ω)], 

u 

ovvero un problema come il problema (3). Ovviamente, questo non è il caso. Infatti se 

facessimo così, ci troveremmo, nuovamente, a dover scegliere u = (u 0 , u 1 , . . . , u n ) prima di 

conoscere ω = (ω 1 , . . .,ω N ), il che distruggerebbe immediatamente tutti i vantaggi di avere 

decisioni e osservazioni mescolate le une con le altre. In particolare, nel nostro caso, se 

ci poniamo nello stadio k-esimo possiamo partizionare il vettore ω = (ω 1 , . . .,ω N ) nei due 

sottovettori 

(ω 1 , . . . , ω k ) informazione disponibile 

(ω k+1 , . . . , ω N ) incertezza residua. 

Nel fare questo, bisogna sempre tenere presente che il fine ultimo dell’ottimizzazione è quello 

di produrre una decisione iniziale u 0 e che le v.a. ω i , i = 1, . . . , N, non saranno mai 

veramente osservate ma, piuttosto, si potrà al più supporre che lo siano state. Per esempio, 

al generico stadio k ci troveremo a dover determinare u k supponendo che siano state osservate 

ω 1 , . . . , ω k . Questo è il motivo per cui, allo stadio k, siamo interessati a determinare, non 

tanto un vettore u k ∈ IR n k 

, quanto piuttosto una funzione di ricorsione definita sullo spazio 

Ω 1 × · · · × Ω k 

u k (·) : (ω 1 , . . . , ω k ) ↦→ u k (ω 1 , . . . , ω k ) ∈ IR n k 

. 

Nello scegliere una tale funzione u k (·) stiamo, in sostanza, specificando nel presente (hereand-now) 

come risponderemo ad ogni possibile realizzazione delle prime k osservazioni. 

Definiamo strategia una funzione u : Ω → IR n ovvero 

u(ω) = (u 0 , u 1 (ω 1 ), u 2 (ω 1 , ω 2 ), . . . , u N (ω 1 , . . .,ω N )). (5) 

Indichiamo con U l’insieme di tutte le possibili funzioni u(·) di questo tipo. Notiamo che 

la componente u k (ω) dipende da ω 1 , . . . , ω k e non da ω k+1 , . . .,ω N . Questa proprietà, detta 

non anticipo delle strategie, serve a garantire che le decisioni non siano basate sulla 

conoscenza di eventi futuri prima che questi accadano. Il problema al quale arriviamo è il 

seguente 

min IE ω[f(u(ω), ω)], 

u(ω)∈U 

dove u(ω) è dato da (5). È importante notare che il precedente è un problema di ottimizzazione 

in cui le variabili di decisione sono particolari funzioni distinte dalla proprietà sopra 

citata di “non anticipo”. 

2.2.1 Esempio: financial planning and control 

Una famiglia americana sta progettando di mandare il proprio figlio al college. I genitori 

sanno che tra Y = Nv anni, e cioè quando il figlio avrà raggiunto l’età per potersi iscrivere, 

la retta per l’intero periodo degli studi sarà di G = 80000 euro. Al momento i genitori 

dispongono di un budget di b = 55000 euro (b < G) e devono decidere come investire questi 

risparmi. Al termine degli Y anni i genitori potranno 

1. prendere in prestito (con un interesse r = 4%) i soldi che servono per arrivare a coprire 

la retta di G euro per l’iscrizione al college; oppure 

20

2. depositare in un libretto di risparmio (con un interesse q = 1%) i soldi avanzati dopo 

il pagamento della retta di iscrizione. 

La famiglia può investire su I tipi diversi di investimento e può cambiare investimento ogni 

v anni. I genitori hanno, quindi, N = Y/v differenti periodi di investimento. 

Supponiamo, per semplicità di trattazione, che I = 2 (due soli tipi di investimento: stock 

o bond), N = 3 (tre periodi) e v = 5 (5 anni di durata minima di ogni investimento). A 

seconda dell’andamento dei mercati finanziari, si può avere un interesse di 1.25 per gli stock 

e 1.14 per i bond oppure 1.06 per gli stock e 1.12 per i bond con uguali probabilità (in 

condizione di massima incertezza). 

Il processo decisionale è quella gia visto in precedenza in cui abbiamo N = 3 stadi di 

ricorsione ovvero 

u 0 = (u 1 0 , u2 0 )T ∈ IR 2 

ω 1 ∈ Ω 

u 1 (ω 1 ) = (u 1 1 (ω 1), u 2 1 (ω 1)) T ∈ IR 2 

ω 2 ∈ Ω 

u 2 (ω 1 , ω 2 ) = (u 1 2 , u2 2 )T ∈ IR n2 

ω 3 ∈ Ω 

u 3 (ω 1 , ω 2 , ω 3 ) = (u 1 3 (ω 1, ω 2 , ω 3 ), u 2 3 (ω 1, ω 2 , ω 3 )) T ∈ IR 2 

decisione iniziale 

osservazione 


osservazione 


osservazione 


dove Ω = {up, down} contiene i due soli andamenti possibili per i mercati finanziari a cui 

corrispondono i tassi di interesse degli investimenti disponibili. 

Stadio iniziale: Le variabili di decisione sono indipendenti dalle v.a. (non anticipo) 

e rappresentano l’ammontare degli investimenti in stock e bond, rispettivamente, 

all’inizio degli Y = 15 anni. Esse devono soddisfare il seguente vincolo 

u 1 0 + u2 0 = b, 

ovvero, inizialmente, gli investimenti devono essere esattamente uguali al budget di 

b euro disponibili all’inizio del periodo di investimento. Potremmo scrivere questo 

vincolo, sinteticamente, come 

∑ 

u i 0 = b. 

i∈I 

Primo stadio: Le variabili di decisione di primo stadio dipendono dalla v.a. ω 1 ma 

non da ω 2 e ω 3 (deve valere la proprietà di non anticipo). Come visto nel corso della 

sezione e considerato il fatto che ω 1 è una v.a. discreta, è possibile definire le funzioni 

u 1 1(ω 1 ) e u 2 1(ω 1 ) in forma tabellare ovvero definendo le variabili u 1 1(up), u 1 1(down), 

u 2 1 (up) e u2 1 (down) che rappresentano le azioni intraprese nei due scenari di primo 

stadio possibili (ed equiprobabili), ovvero ω 1 = up e ω 1 = down. Queste variabili di 

primo stadio devono soddisfare i vincoli 

1.25u 1 0 + 1.14u2 0 = u 1 1 (up) + u2 1 (up) 

1.06u 1 0 + 1.12u 2 0 = u 1 1(down) + u 2 1(down), 

cioè, qualunque sia la realizzazione della v.a. ω 1 , quello che si investe nel quinto anno 

deve essere uguale al capitale disponibile nel quinto anno. Sintetizzando, possiamo 

scrivere questi vincoli come 

∑ 

t ω1,iu i 0 = ∑ u i 1(ω 1 ), ∀ ω 1 ∈ Ω. 

i∈I i∈I 

21

Secondo stadio: Le variabili di decisione di secondo stadio dipendono dalle v.a. ω 1 e 

ω 2 ma non (sempre per la proprietà di non anticipo) dalla v.a. ω 3 . Anche in questo 

caso è possibile definire le funzioni u 1 2 (ω 1, ω 2 ) e u 2 2 (ω 1, ω 2 ) mediante l’introduzione di 

tante variabili di decisione quanti sono i possibili scenari di secondo stadio. Dato che 

i possibili scenari sono dati da tutte le possibili combinazioni di una realizzazione di 

ω 1 con una realizzazione di ω 2 , dobbiamo introdurre complessivamente 8 variabili e 

precisamente: 

u 1 2(up, up), u 1 2(up, down), u 1 2(down, up), u 1 2(down, down), 

u 2 2 (up, up), u2 2 (up, down), u2 2 (down, up), u2 2 (down, down). 

Queste variabili devono soddisfare i vincoli 

1.25u 1 1 (up) + 1.14u2 1 (up) = u1 2 (up, up) + u2 2 (up, up) 

1.06u 1 1(up) + 1.12u 2 1(up) = u 1 2(up, down) + u 2 2(up, down) 

1.25u 1 1 (down) + 1.14u2 1 (down) = u1 2 (down, up) + u2 2 (down, up) 

1.06u 1 1(down) + 1.12u 2 1(down) = u 1 2(down, down) + u 2 2(down, down) 

cioè, qualunque siano le realizzazione delle v.a. ω 1 e ω 2 , quello che si investe nel decimo 

anno deve essere uguale al capitale disponibile nel decimo anno. Anche qui, possiamo 

riscrivere i vincoli di secondo stadio nel modo seguente. 

∑ 

t ω2,iu i 1 (ω 1) = ∑ u i 2 (ω 1, ω 2 ), ∀ ω 1 , ω 2 ∈ Ω. 

i∈I 

i∈I 

Ultimo stadio: Anche nell’ultimo stadio vale un discorso analogo a quello fatto nei due 

stadi precedenti. Infatti, le variabili di decisione dell’ultimo stadio sono funzione di 

ω 1 , ω 2 e ω 3 . La variabile u 1 3(ω 1 , ω 2 , ω 3 ) rappresenta quanto denaro deve essere preso 

in prestito con interesse di r% per poter avere G euro per pagare la rata di iscrizione 

al college. Al contrario, la variabile u 2 3(ω 1 , ω 2 , ω 3 ) rappresenta l’ammontare che può 

essere versato su un libretto di risparmio con interesse di q%, dopo aver pagato la 

retta di G euro per il college. Anche in questo ultimo caso, le funzioni u 1 3 (ω 1, ω 2 , ω 3 ) e 

u 2 3(ω 1 , ω 2 , ω 3 ) possono essere definite mediante l’introduzione di tante variabili quante 

sono le possibili combinazioni delle realizzazioni delle v.a. ω i , i = 1, 2, 3. Tali variabili 

devono soddisfare i seguenti vincoli 

1.25u 1 2 (up, up) + 1.14u2 2 (up, up) = G − u1 3 (up, up, up) + u2 3 

(up, up, up) 

1.25u 1 2 (up, down) + 1.14u2 2 (up, down) = G − u1 3 (up, down, up) + u2 3 (up, down, up) 

1.25u 1 2 (down, up) + 1.14u2 2 (down, up) = G − u1 3 (down, up, up) + u2 3 

(down, up, up) 

1.25u 1 2 (down, down) + 1.14u2 2 (down, down) = G − u1 3 (down, down, up) + u2 3 (down, down, up) 

1.06u 1 2 (up, up) + 1.12u2 2 (up, up) = G − u1 3 (up, up, down) + u2 3 

(up, up, down) 

1.06u 1 2 (up, down) + 1.12u2 2 (up, down) = G − u1 3 (up, down, down) + u2 3 (up, down, down) 

1.06u 1 2 (down, up) + 1.12u2 2 (down, up) = G − u1 3 (down, up, down) + u2 3 

(down, up, down) 

1.06u 1 2 (down, down) + 1.12u2 2 (down, down) = G − u1 3 (down, down, down) + u2 3 (down, down, down) 

cioè, qualunque siano le realizzazione delle v.a. ω 1 , ω 2 e ω 3 , quello di cui si dispone 

nel quindicesimo anno deve essere pari all’importo della retta G, eventualmente prendendo 

a prestito la quantità u 1 3 oppure depositando i contanti in avanzo u 2 3 in un 

libretto di risparmio. Anche questo ultimo gruppo di vincoli possono essere riscritti 

sinteticamente come 

∑ 

t ω3,iu i 2(ω 1 , ω 2 ) + u 1 3(ω 1 , ω 2 , ω 3 ) − u 2 3(ω 1 , ω 2 , ω 3 ) = G, ∀ ω 1 , ω 2 , ω 3 ∈ Ω. 

i∈I 

22

Supponiamo che le tre v.a. siano indipendenti l’una dalle altre, cosicché avremo 

p(ω 1 , ω 2 , ω 3 ) = p(ω 1 )p(ω 2 )p(ω 3 ) = 0.125, 

e, quindi, per la funzione obiettivo (da massimizzare) 

f(u, ω) = ∑ ∑ ∑ 

p(ω 1 , ω 2 , ω 3 )(−ru 1 3 (ω 1, ω 2 , ω 3 ) + qu 2 3 (ω 1, ω 2 , ω 3 )). 

ω 1∈Ω ω 2∈Ω ω 3∈Ω 

Risolvendo il problema otteniamo la seguente soluzione ottima: 

u 1 0 = 41479.3, u 2 0 = 13520.7 

ω 1 ω 2 ω 3 u 1 1 u 2 1 u 1 2 u 2 2 u 1 3 u 2 3 

up up up 0 24799.9 

83839.9 0 

up up down 

0 8870.3 

up down up 65094.6 2168.14 

0 1428.57 

0 71428.6 

up down down 

0 0 

down up up 0 1428.57 

0 71428.6 

down up down 

0 0 

down down up 36743.2 22368 

0 0 

64000 0 

down down down 

12160 0 

2.3 Programmazione Stocastica lineare a due stadi 

Consideriamo nuovamente il caso nel venditore ambulante di giornali visto nella sezione 

precedente. È piuttosto facile ravvisare nel problema del venditore un problema di programmazione 

stocastica a due stadi con una sola v.a. (la domanda D di giornali). 

x ∈ IR 

D ∈ Ω 

u 1 ∈ IR 2 

primo stadio: decisione sul numero di giornali da acquistare 

osservazione: diventa noto il numero di giornali venduti 

secondo stadio: decisioni di ricorsione 

il vettore delle decisioni di ricorsione è composto di due elementi e precisamente 

u 11 ≡ giornali venduti al semaforo = min{x, D} e 

u 12 ≡ giornali rivenduti all’editore = max{0, x − D}. 

Riassumendo, il venditore deve decidere “here-and-now” quanti giornali x ∈ IR acquistare 

dall’editore non sapendo quanto varrà la domanda D nella mattinata. Tuttavia, quale che 

sia la realizzazione della v.a. D, egli reagirà all’osservazione della v.a. con una decisione 

di secondo stadio o funzione di ricorsione u 1 (D) : Ω → IR 2 essendo (u 1 (D)) 1 il numero di 

giornali venduti al semaforo e (u 1 (D)) 2 il numero di giornali rivenduti all’editore. 

Più on generale, in un modello stocastico a due stadi si indica con 

- x ∈ IR n1 il vettore delle decisioni di primo stadio; 

- ω ∈ Ω la v.a. la cui realizzazione fa da margine tra primo e secondo stadio; 

- y(ω) ∈ IR n2 il vettore delle decisioni di secondo stadio. 

23

Il problema è dunque quello di risolvere 

min IE ω[f(x, y(ω))], 

x,y(ω) 

potendo f(x, y(ω)) essere una generica funzione (non lineare) e a valori sullo spazio esteso 

¯ IR. Poniamoci ora in un contesto lineare. In questo assetto alla decisione di primo stadio x 

corrisponde un costo lineare c T x e dei vincoli lineari in forma standard Ax = b, x ≥ 0. Allo 

steso modo, alla decisione di secondo stadio y(ω) corrisponderà un costo lineare q(ω) T y(ω) 

e dei vincoli lineari W(ω)y(ω) = h(ω) − T(ω)x, y(ω) ≥ 0. Il problema è dunque 

min c T x + IE ω [q(ω) T y(ω)] 

Ax = b, x ≥ 0 

W(ω)y(ω) = h(ω) − T(ω)x q.c. 

y(ω) ≥ 0 q.c. 

(6) 

ove le matrici W(ω) e T(ω) sono dette, rispettivamente, matrice di ricorsione e matrice della 

tecnologia. Se la matrice W non dipende dalla v.a. ω si parla di problema con ricorsione 

fissa. 

Notiamo che i vincoli di secondo stadio dipendono dalla realizzazione della v.a. ω. Nel 

seguito supporremo che tali vincoli siano soddisfatti q.c. ovvero quasi certamente cioè che 

siano soddisfatti per ogni ω ∈ Ω tranne che al più per ogni ω ∈ A con P ω (A) = 0 (ovvero A 

insieme con probabilità nulla). 

Se pensiamo ad x e ω come parametri, ovvero ci poniamo nel secondo stadio quando la 

decisione iniziale è stata presa e la v.a. si è realizzata, il problema che ci troviamo ad 

affrontare è il seguente: 

min q(ω) T y 

W(ω)y = h(ω) − T(ω)x 

y ≥ 0. 

Sia ora Q(x, ω) = inf{q(ω) T y : W(ω)y = h(ω) − T(ω)x, y ≥ 0} e Q(x) = IE ω [Q(x, ω)]. 

Definiamo problema proiettato il seguente 

min c T x + Q(x) 

Ax = b, x ≥ 0 

ove, in pratica, è stata eliminata la dipendenza esplicita dalla v.a. ω. Abbiamo ricorsione 

relativamente completa quando Q(x) assume valori finiti per ogni x ∈ IR n1 tale che Ax = b 

e x ≥ 0. Diciamo, invece, che si ha ricorsione completa quando Q(x) assume valori finiti per 

ogni x ∈ IR n1 . 

2.4 Esempi di modelli stocastici lineari a due stadi 

2.4.1 Il problema dell’azienda agricola 

Una azienda agricola europea è specializzata nella coltivazione di grano, frumento e barbabietole 

da zucchero e nell’allevamento di mucche da latte. In totale l’azienda possiede 500 

acri di terra che possono essere utilizzati per i diversi tipi di coltivazione. È noto che ogni 

anno sono necessari per l’allevamento del bestiame almeno 200 Ton. di farina e 240 Ton. di 

frumento. Naturalmente l’azienda può fare fronte a queste necessita o con il proprio raccolto 

24

oppure acquistando da un grossista della zona. La produzione agricola dell’azienda oltre a 

servire per l’allevamento del bestiame può essere venduta sul mercato ad un prezzo di 170 

euro per una Ton. di farina e 150 euro per una Ton. di frumento. I prezzi di acquisto di 

farina e frumento dal grossista sono maggiorati del 40% per via dei costi di trasporto che 

quest’ultimo deve sostenere. Per quanto riguarda la barbabietola, il prezzo di vendita è di 

36 euro/Ton; tuttavia, la commissione europea ha imposto all’azienda una quota di produzione 

per le barbabietole di 6000 Ton. l’anno. La quantità di barbabietola eventualmente 

prodotta oltre questa quota potrà essere venduta ad un prezzo ribassato e precisamente a 

10 euro/Ton. 

Basandosi sulla propria esperienza passata, l’azienda agricola sa che ogni acro di terra coltivato 

a frumento, grano o barbabietola frutta rispettivamente 2.5, 3 e 20 Ton. Per finire, 

per ogni acro di terra l’azienda deve sostenere dei costi di semina che sono di 150 euro, 230 

euro e 260 euro rispettivamente per grano, frumento e barbabietole. La tabella che segue 

riassume i dati fin qui esposti: 

Grano Frumento Barbabietole 

Raccolto (Ton./acri) 2.5 3 20 

Costo di semina (euro/acri) 150 230 260 

Prezzo di vendita (euro/Ton.) 170 150 36 sotto 6000 Ton. 

10 sopra 6000 Ton. 

Prezzo di acquisto (euro/Ton.) 238 210 – 

Richieste min. (Ton.) 200 240 – 

Per scegliere le migliore strategia di semina, l’azienda dovrebbe ricorrere al seguente modello 

lineare. 

Siano: 

x 1 = acri di terra piantati a grano; 

x 2 = acri di terra piantati a frumento; 

x 3 = acri di terra piantati a barbabietole; 

w 1 = ton. di grano venduto; 

y 1 = ton. di grano acquistato; 

w 2 = ton. di frumento venduto; 

y 2 = ton. di frumento acquistato; 

w 3 = ton. di barbabietole vendute a prezzo pieno; 

w 4 = ton. di barbabietole vendute a prezzo ribassato; 

25

Il problema da risolvere è il seguente: 

min 150x 1 + 230x 2 + 260x 3 + 238y 1 − 170w 1 + 

+210y 2 − 150w 2 − 36w 3 − 10w 4 

c.v. x 1 + x 2 + x 3 ≤ 500 

2.5x 1 + y 1 − w 1 ≥ 200 

3x 2 + y 2 − w 2 ≥ 240 

20x 3 − w 3 − w 4 ≥ 0 

w 3 ≤ 6000 

x i , y j , w h ≥ 0 i = 1, 2, 3, j = 1, 2, h = 1, 2, 3, 4. 

Risolvendo il problema precedente otteniamo la seguente soluzione ottima 

Coltivazione Grano Frumento Barbabietole 

x i 120 80 300 

Raccolto (Ton.) 300 240 6000 

w i 100 – 6000 (w 4 = 0) 

y i – – 

Profitto complessivo: 118600 euro 

L’azienda agricola pur soddisfatta da questa soluzione ottima sa perfettamente che di anno 

in anno e a parità di seminato, i raccolti possono variare sensibilmente. in particolare non 

è usuale avere stagioni con raccolti che sono superiori o inferiori del 20% rispetto alle stime 

usate nel problema precedente. Più precisamente, nel caso di una stagione particolarmente 

buona ogni acro seminato a grano, frumento e barbabietole frutterà, rispettivamente, 3, 3.6 

e 24 Ton. di raccolto. Vice versa, nel caso di una stagione sotto la media ogni acro seminato 

a grano, frumento e barbabietole frutterà, rispettivamente, 2, 2.4 e 16 Ton. di raccolto. 

Possiamo a questo punto risolvere due ulteriori problemi di ottimizzazione corrispondenti 

agli scenari di stagione sopra e sotto la media e ottenere le seguenti soluzioni ottime: 

stagione sopra la media: raccolto + 20% 


x i 183.33 66.67 250 

Raccolto (Ton.) 550 240 6000 

w i 350 – 6000 (w 4 = 0) 

y i – – 


26

stagione sotto la media: raccolto - 20% 


x i 100 25 375 

Raccolto (Ton.) 200 60 6000 

w i – – 6000 (w 4 = 0) 

y i – 180 


Ragionando sul problema in esame è facile convincersi del fatto che la decisione sulle quantità 

di terra da seminare con le differenti colture (x i , i = 1, 2, 3) deve essere presa prima di 

conoscere l’esito della stagione (se nella norma, sopra la media o sotto la media). Al contrario 

le quantità da vendere e comprare dei differenti prodotti (y i , i = 1, 2 e w j , j = 1, 2, 3, 4) 

dipendono dal raccolto. 

Supponiamo di assegnare a ciascuno dei tre scenari disponibili (sotto la media, in media e 

sopra la media) un indice s = 1, 2, 3 e definire le variabili w js , j = 1, 2, 3, 4 e y is , i = 1, 2 

dove, per esempio, w 32 rappresenta la quantità di barbabietole vendute a prezzo pieno nel 

caso di un raccolto nella media. 

Se ipotiziamo che l’s-esimo scenario abbia probabilita p s = 1/3 con ∑ 3 

s=1 p s = 1 allora 

possiamo scrivere il seguente problema 

min 150x 1 + 230x 2 + 260x 3 + 

+ 1 3 (238y 11 − 170w 11 + 210y 21 − 150w 21 − 36w 31 − 10w 41 ) 

+ 1 3 (238y 12 − 170w 12 + 210y 22 − 150w 22 − 36w 32 − 10w 42 ) 

+ 1 3 (238y 13 − 170w 13 + 210y 23 − 150w 23 − 36w 33 − 10w 43 ) 

c.v. x 1 + x 2 + x 3 ≤ 500 

2x 1 + y 11 − w 11 ≥ 200 

2.4x 2 + y 21 − w 21 ≥ 240 

16x 3 − w 31 − w 41 ≥ 0 

w 31 ≤ 6000 

2.5x 1 + y 12 − w 12 ≥ 200 

3x 2 + y 22 − w 22 ≥ 240 

20x 3 − w 32 − w 42 ≥ 0 

w 32 ≤ 6000 

3x 1 + y 13 − w 13 ≥ 200 

3.6x 2 + y 23 − w 23 ≥ 240 

24x 3 − w 33 − w 43 ≥ 0 

w 33 ≤ 6000 

x i , y js , w hs ≥ 0 i = 1, 2, 3, j = 1, 2, h = 1, 2, 3, 4, s = 1, 2, 3. 

Risolvendo questo problema otteniamo la soluzione seguente: 

27

Grano Frumento Barbabietole 

x i 170 80 250 

s=1 Raccolto (Ton.) 340 192 4000 

w i1 140 0 w 31 = 4000, 

y i1 0 48 

w 41 = 0 

s=2 Raccolto (Ton.) 425 240 5000 

w i2 225 0 w 32 = 5000, 

y i2 0 0 

w 42 = 0 

s=3 Raccolto (Ton.) 510 288 6000 

w i3 310 48 w 33 = 6000, 

y i3 0 0 


w 43 = 0 

Notiamo che, a differenza di quanto accadeva nell’esempio del venditore di giornali, qui la 

v.a. ω non è direttamente associata ad un valore numerico. La v.a. ω ha valori sull’insieme 

Ω = {ω 1 , ω 2 , ω 3 } con ω 1 = “stagione sopra la media”, ω 2 = “stagione nella media” e ω 3 = 

“stagione sotto la media”. Nel problema precedente, gli unici elementi che dipendono dalla 

v.a. ω sono gli elementi della matrice della tecnologia essendo 

⎛ 

⎞ 

T(ω) = 

⎜ 

⎝ 

t 11 (ω) 0 0 

0 t 22 (ω) 0 

0 0 t 33 (ω) 

⎟ 

⎠ . 

2.4.2 Gestione degli investimenti per un impianto di distribuzione 

elettrica 

Un ente per la distribuzione di energia elettrica deve pianificare i propri investimenti in nuovi 

impianti di generazione per poter soddisfare la domanda nazionale attuale e futura su un 

orizzonte temporale di 15 anni. I nuovi impianti devono essere costruiti all’inizio del primo 

anno e devono essere operativi per tutti i 15 anni dell’orizzonte di pianificazione. L’ente 

dispone di un budget b di 10 miliardi di euro che possono essere allocati per la costruzione 

di 4 differenti tipi di impianti di produzione e precisamente: impianto con turbine a gas, 

impianto a carbone, impianto nucleare e impianto idroelettrico. Il costo di costruzione di 

ciascun tipo di impianto dipende dalla sua capacità ovvero dalla massima potenza elettrica 

(in GW) erogabile dell’impianto stesso ed infatti, abbiamo i seguenti costi: 

Impianto mln. euro/GW di capacità 

Gas 110 

Carbone 180 

Nucleare 450 

Idrico 950 

28

Inoltre, data la limitata disponibilità di corsi d’acqua utilizzabili per produrre elettricità, un 

eventuale nuovo impianto idroelettrico non potrà avere una capacità superiore a 5 GW. 

Oltre all’investimento iniziale per la costruzione, ciascun tipo di impianto comporta anche 

dei costi di esercizio (espressi in euro/KWh) come riportato nella tabella seguente in cui si 

riporta anche il costo per l’acquisto di un KWh di energia elettrica da un fornitore estero. 

Impianto 

Gas 

Carbone 

costo di eser. euro/KWh 

ω G 

ω C 

Nucleare 0.0140 

Idrico 0.0040 

Acquisto 0.1500 

I costi per la produzione di un KWh di energia elettrica con impianto a gas e a carbone sono 

v.a. discrete indipendenti con le seguenti distribuzioni: 

ω G P(ω G ) ω C P(ω C ) 

0.0310 0.1 0.0170 0.1 

0.0330 0.2 0.0210 0.2 

0.0390 0.4 0.0240 0.4 

0.0450 0.2 0.0290 0.2 

0.0490 0.1 0.0310 0.1 

Per pianificare al meglio i propri investimenti, l’ente si basa sulla conoscenza dell’andamento 

della richiesta di potenza elettrica per il primo anno. In particolare, sono stati individuati 

5 blocchi di consumo e per ciascuno di essi è nota la durata in ore (nell’anno) e la potenza 

richiesta (d ◦ j in GW) come riportato nella tabella che segue 

Blocco j d ◦ j (GW) Durata (ore) 

# 1 10.0 490 

# 2 8.4 730 

# 3 6.7 2190 

# 4 5.4 3260 

# 5 4.3 2090 

Così, è noto che, nel corso del primo anno, ci sarà una richiesta di 10 GW di potenza 

per un ammontare complessivo di 490 ore. La richiesta sarà di 8.4 GW per 730 ore, 6.7 

GW per 2190 e così via. Basandosi sui dati in suo possesso e grazie a delle approfondite 

ricerche di mercato, l’ente ha stabilito che nei prossimi 15 anni (periodo di pianificazione 

dell’investimento), si potranno verificare i seguenti trend di incremento/decremento delle 

richieste di potenza elettrica: 

29

ω R P(ω R ) 

-0.01 0.2 

0.01 0.2 

0.03 0.2 

0.05 0.2 

0.07 0.2 

È inoltre noto che le tre v.a. ω G , ω C e ω R sono indipendenti tra di loro. Quindi, se indichiamo 

con Ω G , Ω C e Ω R , rispettivamente, lo spazio di tutti i possibili eventi associati alle tre v.a. 

ω G , ω C e ω R , avremo che Ω = Ω G × Ω C × Ω R è lo spazio degli scenari possibili che sono 

complessivamente pari a |Ω G × Ω C × Ω R | = 5 × 5 × 5 = 125. Pertanto, ogni scenario 

ω = (ω G , ω C , ω R ) ∈ Ω ha una probabilità data dal prodotto delle probabilità dei singoli 

eventi cioè: P(ω) = P(ω G )P(ω C )P(ω R ). 

Indichiamo con: 

- x i , i = 1, 2, 3, 4, la capacità (in GW) dei nuovi impianti, rispettivamente, a Gas, a 

Carbone, Nucleare e Idroelettrico. 

- c i , i = 1, 2, 3, 4, i costi di costruzione (in milioni di euro/GW) associati ai 4 differenti 

tipi di impianto. 

- y ijk (ω), i = 1, . . .,5, j = 1, . . .,5 e k = 1, . . .,5, la frazione di capacità elettrica 

(in GW) utilizzata per produrre elettricità con impianto di tipo i, per il blocco di 

richiesta j nell’anno k. Notiamo che, quando i = 5, y 5jk indicherà la quantità di 

elettricità acquistata da un fornitore estero per soddisfare la domanda nel blocco j 

dell’anno k. Queste variabili sono, in realtà funzioni della v.a. ω. 

- q 1 (ω), q 2 (ω), q 3 , q 4 , q 5 , i costi di esercizio (in euro/KWh), rispettivamente, di impianti a 

Gas, Carbone, Nucleare, Idroelettrico e per l’acquisto da un fornitore estero. Notiamo 

che i primi due costi dipendono dalle realizzazioni della v.a. ω ∈ Ω. 

- h j , j = 1, 2, 3, 4, 5, la durata (in ore) di ciascun blocco di consumo. 

- D jk (ω), j = 1, . . .,5 e k = 1, . . .,15, la potenza richiesta (in GW) nel blocco j dell’anno 

k. In particolare, vale la relazione D jk (ω) = d ◦ j (1 + (k − 1)ω R), per ogni j = 1, . . .,5 e 

k = 1, . . .,15, dove d ◦ j indica la richiesta nel primo anno per i vari blocchi di domanda. 

Le informazioni sulle quantità D jk (ω) possono essere così riassunte: 

j ω R D j1(ω) D j2(ω) ... D j14(ω) D j15(ω) 

1 -0.1 10 9.9 ... 8.7 8.6 

1 0.1 10 10.1 ... 11.3 11.4 

1 0.3 10 10.3 ... 13.9 14.2 

1 0.5 10 10.5 ... 16.5 17.0 

1 0.7 10 10.7 ... 19.1 19.8 

. 

. 

. 

. · · · 

. 

. 

5 -0.1 4.3 4.257 ... 3.741 3.698 

5 0.1 4.3 4.343 ... 4.859 4.902 

5 0.3 4.3 4.429 ... 5.977 6.106 

5 0.5 4.3 4.515 ... 7.095 7.31 

5 0.7 4.3 4.601 ... 8.213 8.514 

30

Riassumendo, otteniamo il seguente problema di programmazione stocastica lineare a due 

stadi. 

⎡ 

⎤ 

5∑ 5∑ ∑15 

c T x + IE ω 

⎣ q i (ω)h j y ijk (ω) ⎦ 

min 

x,y 

c T x ≤ 10000 

x 4 ≤ 5.0 

x ≥ 0 

i=1 j=1 k=1 

y ijk (ω) ≤ x i , j = 1, . . .,5, k = 1, . . . , 15, i = 1, . . .,4, 

5∑ 

y ijk (ω) ≥ D jk (ω), j = 1, . . .,5, k = 1, . . . , 15 

i=1 

y ijk (ω) ≥ 0, j = 1, . . .,5, k = 1, . . . , 15, i = 1, . . .,5. 

Risolvendo il problema, otteniamo il seguente piano di investimenti, in termini di capacità 

installate (variabili x i , i = 1, . . .,4): 

Impianto i Capacità x i 

Gas 1 3.366 GW 

Carbone 2 3.953 GW 

Nucleare 3 4.313 GW 

Idrico 4 5.000 GW 

Il costo atteso complessivo del piano di investimento all’ottimo è pari a 15828.81856 milioni 

di euro. Il piano di investimenti ottimo prevede, tra l’altro, che, date le installazioni ottime 

di capacità x ⋆ come riportate nella tabella che precede, un trend di crescita della domanda 

del 7% e i costi operativi delle centrali a gas e carbone rispettivamente di 3.9 e 2.4 eurocent 

per KWh, le potenze erogate dai singoli impianti nel 15 anno siano pari a (y ij15 (ω) per 

i = 1, . . .,5, j = 1, . . .,5 e dove ω = (ω G , ω C , ω R ) con ω G = 0.039, ω C = 0.024 e ω R = 0.07). 

Impianto 

Blocco di domanda 

1 2 3 4 5 

Gas 3.366 3.366 0.469 0 0 

Carbone 3.953 3.953 3.953 1.757 0 

Nucleare 4.313 4.313 4.313 4.313 3.815 

Idrico 5 5 5 5 5 

Fornitore 3.868 0.588 0 0 0 

2.5 Programmazione stocastica lineare a due stadi con 

ricorsione fissa 

Consideriamo nuovamente il problema (6) ove W(ω) = W ovvero 

min c T x + IE ω [q(ω) T y(ω)] 

Ax = b, x ≥ 0 

Wy(ω) = h(ω) − T(ω)x q.c. 

y(ω) ≥ 0 q.c. 

31

oppure, equivalentemente, il problema proiettato 

min c T x + IE ω [Q(x, ω)] 

Ax = b, x ≥ 0 

(7) 

dove 

Q(x, ω) = inf 

q T y 

Wy = h − Tx 

y ≥ 0. 

(8) 

Sia Q(x) = IE ω [Q(x, ω)] la così detta funzione di ricorsione mediante la quale possiamo 

scrivere, come gia visto, il problema proiettato seguente 

min c T x + Q(x) 

Ax = b, x ≥ 0. 

(9) 

2.5.1 Esempio: il problema del venditore di giornali 

Consideriamo nuovamente l’esempio visto in sezione 2.1.4. Come gia abbiamo visto, il 

problema del venditore di giornali può essere formulato come problema di programmazione 

stocastica lineare a due stadi con risorsione fissa. La situazione del venditore è infatti la 

seguente 

x ∈ IR 

D ∈ Ω 

y ∈ IR 2 

primo stadio: decisione sul numero di giornali da acquistare 

osservazione: diventa noto il numero di giornali venduti 

secondo stadio: decisioni di ricorsione 

In particolare, una volta acquistati gli x giornali dall’editore e avvenuta la realizzazione della 

v.a. D, il venditore adotterà le decisioni di secondo stadio ovvero deciderà quanti giornali 

vendere al semaforo e quanti rivenderne all’editore a fine mattinata. Il problema è quindi 

min x 

c T x + Q(x) 

x ≥ 0, 

con Q(x) = IE D [Q(x, D)] e 

Q(x, D) = 

inf −sy 1 − ry 2 

y 

y 1 + y 2 = x 

y 1 ≤ D 

y 1 , y 2 ≥ 0. 

La regione ammissibile del problema primale, vale a dire l’insieme Y (h − Tx), è sempre non 

vuota e anzi il problema primale ammette sempre soluzione ottima (qualunque sia il valore 

di x e D) pari a 

⎧ ( ) 

x 

se x ≤ D 

( ) 

y 

⋆ 

⎪⎨ D − x 

1 

= 

y2 

⋆ ( ) 

D 

⎪⎩ 

se x > D 

x − D 

32

Ricordando che, nell’esempio in esame T = (−1, 0) T , abbiamo che il subdifferenziale ∂Q(x, D) 

contiene il subgradiente −s se −sx = −sy ⋆ 1 − ry⋆ 2 e −r se −rx − D(s − r) = −sy⋆ 1 − ry⋆ 2 o 

entrambi se −rx −D(s −r) = −sx. Percui, se vogliamo stabilire come è fatto il subdifferenziale 

∂Q(x, D) quando x = D = 30 e s = 1.8, c = 1.6 e r = 0.8, allora dobbiamo confrontare 

il valore Q(30, 30) = −30s con i valori all’ottimo della funzione obiettivo duale ovvero −30s 

e −30r − 30(s − r) = −30s. Pertanto 

∂Q(30, 30) = conv{−s, −r}, 

ovvero il subdifferenziale contiene i subgradienti −s e −r e tutte le loro combinazioni 

convesse. 

Ovviamente, potranno esistere valori di x e D per cui la funzione Q(x, D) è differenziabile 

ovvero per cui il subdifferenziale si riduce ad un singleton contenente come suo unico elemento 

il gradiente ∇Q(x, D). Per esempio, se consideriamo per D = 30 il punto x = 40, 

abbiamo che Q(40, 30) = −30s − 10r = −40r − 30(s − r), pertanto, 

∂Q(40, 30) = {∇Q(40, 30)} = {−r}. 

2.6 Indicatori di validità e attendibilità della Programmazione 

Stocastica 

Come gia abbiamo avuto modo di osservare in precedenza, risolvere un problema di programmazione 

stocastica è, in taluni casi, equivalente alla soluzione di un problema di grandi 

dimensioni cioè con un elevato numero di variabili e/o di vincoli. Pertanto, in generale, 

determinare la soluzione di un problema di programmazione stocastica lineare è molto costoso. 

Ha quindi senso chiedersi quando e quanto sia conveniente abbandonare il problema 

stocastico e risolvere, invece, un problema più semplice. In particolare, è lecito chiedersi 

in che misura approcci più semplici al problema, come per esempio quello che prevede di 

sostituire alla v.a. il suo valor medio, forniscano soluzioni che si discostano dall’ottimo o 

fine a che punto questi approcci “alternativi” non siano completamente inaccurati. 

Una risposta a queste domande può essere fornita da due importanti indicatori di bontà 

dell’approccio stocastico che sono: 

1. l’EVPI (Expected Value of Perfect Information) ovvero il valore atteso in condizioni 

di informazione completa e, 

2. l’VSS (Value of Stochastic Solution) ovvero il valore della soluzione stocastica. 

Al fine di definire chiaramente questi due importanti indicatori, introduciamo brevemente 

alcune definizioni che ci faranno comodo nel seguito. 

Sia ω ∈ Ω una v.a. discreta ovvero che può avere solo un numero finito N di realizzazioni 

ω 1 , . . . , ω N . Sia f(x ⋆ (ω i ), ω i ) il valore ottimo del problema di programmazione stocastica 

quando si fissa la v.a. ω al valore ω i , i = 1, . . .,N. Percui, data una realizzazione ω i 

della v.a. ω ∈ Ω, associamo ad essa il valore all’ottimo del corrispondente problema di 

programmazione matematica f(x ⋆ (ω i ), ω i ). f(x ⋆ (ω), ω) è pertanto una v.a. composta per 

cui è possibile definire il valore atteso. Infatti, definiamo soluzione wait-and-see 

WS = IE ω [f(x ⋆ (ω), ω)], 

il valore atteso della v.a. f(x ⋆ (ω), ω). Definiamo, invece, soluzione here-and-now come il 

valore della soluzione del problema di programmazione stocastica 

HN = min IE ω [f(x, ω)]. 

x 

33

A questo punto, definiamo l’EVPI (valore atteso in condizioni di informazione completa) 

come 

EV PI = HN − WS. 

Nel caso dell’esempio del venditore di giornali, abbiamo che, come risulta dalla tebella che 

segue, WS = −10.57142 

Risulta, inoltre, x ⋆ = 40, 

Q(x ⋆ ) = −1.8D 1 − 0.8(x ⋆ − D 1 ) 

7 

i p i D i x ⋆ (D i ) f(x ⋆ (D i ), D i ) 

1 1/7 30 30 -6 

2 2/7 40 40 -8 

3 2/7 50 50 -10 

4 1/7 60 60 -12 

5 1/7 100 100 -20 

− 6 1.8x⋆ 

7 

e quindi HN = 1.6x ⋆ + Q(x ⋆ ) = −6.57142. Otteniamo così EV PI = 4. Questo valore è 

pari alla quantità di euro che il venditore sarebbe disposto a pagare ogni mattina pur di 

sapere quanti giornali potrà vendere al semaforo. 

Quando ci si trova a dover risolvere un problema di ottimizzazione con incertezza, molto 

spesso si ritiene di poter ottenere una buona approssimazione della soluzione ottima semplicemente 

risolvendo il problema 

EV = min f(x, ¯ω), 

x 

dove si è sostituita la v.a. ω con il suo valore atteso ¯ω = IE ω [ω]. La soluzione di questo 

problema è nota come soluzione EV (expected value) ovvero soluzione di valor medio. L’indicatore 

VSS è quello che ci dice quanto la soluzione EV sia lontana dall’essere ottima per il 

problema di programmazione stocastica. In particolare, una volta nota la soluzione ottima 

x ⋆ (¯ω) del problema EV, definiamo 

EEV = IE ω [f(x ⋆ (¯ω), ω)] = c T x ⋆ (¯ω) + Q(x ⋆ (¯ω)) 

ovvero il valore atteso quando si usa la soluzione di valor medio. Il VSS è definito come 

V SS = EEV − HN. 

Di nuovo, nel caso del venditore di giornali, abbiamo che x ⋆ ( ¯D) = 370/7 e EV = −10.57142. 

Come risulta dalla tabella che segue abbiamo 

i p i D i cx ⋆ ( ¯D) + Q(x ⋆ ( ¯D), D i ) f(x ⋆ ( ¯D), D i ) 

1 1/7 30 1.6x ⋆ ( ¯D) − 1.8D 1 − 0.8(x ⋆ ( ¯D) − D 1 ) 12.28571 

2 2/7 40 1.6x ⋆ ( ¯D) − 1.8D 2 − 0.8(x ⋆ ( ¯D) − D 2 ) 2.28571 

3 2/7 50 1.6x ⋆ ( ¯D) − 1.8D 3 − 0.8(x ⋆ ( ¯D) − D 3 ) -7.71429 

4 1/7 60 1.6x ⋆ ( ¯D) − 1.8x ⋆ ( ¯D) -10.57143 

5 1/7 100 1.6x ⋆ ( ¯D) − 1.8x ⋆ ( ¯D) -10.57143 

34

EEV = IE D [f(x ⋆ ( ¯D), D)] = −2.81634 e quindi V SS = 3.75508 che ci dice esattamente di 

quanto la soluzione del problema EV si discosta dalla soluzione HN. 

Consideriamo ora l’esempio dell’azienda agricola. Come gia abbiamo visto, in questo caso 

HN = −108390. Calcoliamo ora WS. Nel caso in cui ω = ω 1 (stagione sotto la media), 

risulta z(x(ω 1 ), ω 1 ) = −59950; quando ω = ω 2 (stagione nella media), z(x(ω 2 ), ω 2 ) = 

−118600; quando ω = ω 3 (stagione sopra la media), z(x(ω 3 ), ω 3 ) = −167667; cosicche 

WS = z(x(ω 1 ), ω 1 )/3 + z(x(ω 2 ), ω 2 )/3 + z(x(ω 3 ), ω 3 )/3 = −115405.56. Quindi otteniamo 

EV PI = HN − WS = 7015.6 

il che significa che l’azienda sarebbe disposta a pagare 7015.6 euro ogni anno per poter 

conoscere quale sarà l’andamento della stagione. 

Calcoliamo ora l’EV dell’esempio dell’azienda agricola che otteniamo semplicemente risolvendo 

il problema in cui si è fissata la v.a. al suo valor medio il che, ovviamente, equivale a risolvere 

il problema nel caso di stagione nella media per cui otteniamo x(¯ω) = (120, 80, 300) T . 

Possiamo ora calcolare l’EEV che risulta EEV = −107240 per cui otteniamo 

V SS = EEV − HN = 1150. 

2.7 Richiami sulle funzioni convesse 

Indichiamo con IR ¯ e IR ¯ gli insiemi estesi IR ∪ {+∞} e IR ∪ {−∞, +∞}, rispettivamente. Sia 

f : S → IR ¯ con S ⊆ IR n . L’insieme 

{(x, µ) : x ∈ S, µ ∈ IR, f(x) ≤ µ} 

è detto epigrafo di f ed è indicato epi f. Diciamo che f è una funzione convessa su S se 

epi f è un sottoinsieme convesso di IR n+1 . Il dominio effettivo della funzione f su S è la 

proiezione su IR n dell’epigrafo di f ovvero 

dom f = {x : ∃µ, (x, µ) ∈ epi f} = {x : f(x) < +∞}. 

Notiamo che data una funzione f su S convessa, è sempre possibile ottenere una funzione 

f ′ definita su IR n e ancora convessa. Per fare questo è sufficiente considerare la funzione 

{ 

f(x) se x ∈ S, 

f ′ (x) = 

+∞ se x ∉ S. 

Dal momento che le funzioni che stiamo calcolando hanno valori nello spazio esteso ¯ IR, è 

necessario fornire delle regole che specifichino il risultato delle operazioni aritmetiche fondamentali 

quando sono coinvolti i simboli +∞ o −∞. In particolare, adotteremo le seguenti 

regole: 

1. α + ∞ = ∞ + α = ∞ per ogni −∞ < α ≤ ∞; 

2. α − ∞ = −∞ + α = −∞ per ogni −∞ ≤ α < ∞; 

3. α∞ = ∞α = ∞, α(−∞) = (−∞)α = −∞ per ogni 0 < α ≤ ∞; 

4. α∞ = ∞α = −∞, α(−∞) = (−∞)α = ∞ per ogni −∞ ≤ α < 0; 

5. 0∞ = ∞0 = 0 = 0(−∞) = (−∞)0, −(−∞) = ∞; 

6. ∞ − ∞ = −∞ + ∞ = ∞; 

35

7. inf ∅ = +∞, sup ∅ = −∞. 

Una funzione convessa f è detta propria se f(x) < +∞ per almeno un x e f(x) > −∞ per 

ogni x. Una funzione convessa che non è propria è detta impropria. In particolare se f è 

una funzione convessa finita definita sull’insieme convesso C, la funzione f ′ definita su tutto 

IR n { 

f(x) se x ∈ C, 

f ′ (x) = 

+∞ se x ∉ C. 

è una funzione convessa e propria. 

Proposizione 2.7.1 Sia f : C → ¯ IR, dove C ⊆ IR n . f è una funzione convessa su C se e 

solo se 

1. C è un insieme convesso; 

2. comunque scelti x, y ∈ C risulta 

f((1 − λ)x + λy) ≤ (1 − λ)f(x) + λf(y), 0 < λ < 1. 

Proposizione 2.7.2 Sia f : IR n → ¯ IR. f è una funzione convessa se e solo se comunque 

presi due punti x, y ∈ IR n per cui esistono due scalari α, β < +∞ tali che f(x) < α e 

f(y) < β allora 

f((1 − λ)x + λy) < (1 − λ)α + λβ, 0 < λ < 1. 

Proposizione 2.7.3 (Disuguaglianza di Jensen) Sia f : IR n → ¯ IR. Allora f è convessa 

se e solo se 

f(λ 1 x 1 + · · · + λ m x m ) ≤ λ 1 f(x 1 ) + · · · + λ m f(x m ), 

comunque scelti i vettori x i ∈ IR n , i = 1, . . . , m, dove gli scalari λ i sono tali che λ i ≥ 0, 

i = 1, . . .,m e 

m∑ 

λ i = 1. 

i=1 

2.8 Definizioni 

Dato S ⊂ IR n , diciamo che S è un insieme convesso quando, comunque presi due punti 

x, y ∈ S, risulta, per ogni scalare λ ∈ [0, 1] 

λx + (1 − λ)y ∈ S. 

Sia S ⊂ IR n un insieme convesso. Diciamo che la funzione f : IR n → IR è convessa su 

S quando, comunque presi due punti x, y ∈ S, risulta, per ogni scalare λ ∈ [0, 1] 

f(λx + (1 − λ)y) ≤ λf(x) + (1 − λ)f(y). 

36

Data una funzione f : IR n → IR convessa sul’insieme convesso X e un punto x o ∈ X, 

diciamo che un vettore η ∈ IR n è un subgradiente di f(x) in x o quando: 

f(x) ≥ f(x o ) + η T (x − x o ), ∀ x ∈ X. 

Data una funzione f : IR n → IR convessa sul’insieme convesso X e un punto x o ∈ X, 

definiamo il subdifferenziale di f(x) in x o come segue: 

∂f(x o ) = conv{η ∈ IR n : f(x) ≥ f(x o ) + η T (x − x o ), 

∀ x ∈ X}. 

Una funzione f(x) si dice positivamente omogenea quando, comunque preso uno scalare 

λ ≥ 0, risulta f(λx) = λf(x). 

Sia S ⊂ IR n un insieme convesso. Definiamo funzione di supporto dell’insieme S la 

funzione σ S : IR n → IR 

σ S (x) = sup x T y. 

y∈S 

37

Indice 

1 Programmazione Multiobiettivo 1 

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 Ottimalità secondo Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.2.1 Esercizio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

1.3 Condizioni di Ottimalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.3.1 Condizioni di Fritz-John . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.3.2 Condizioni di Karush-Kuhn-Tucker . . . . . . . . . . . . . . . . . . . . 7 

1.4 Metodi di Soluzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

1.4.1 Metodi Senza Preferenze . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

1.4.2 Metodi a Posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

2 Programmazione con Incertezza 13 

2.1 Nozioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.1.1 Formulazione deterministica . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.1.2 Osservazione e ottimizzazione . . . . . . . . . . . . . . . . . . . . . . . 14 

2.1.3 Ottimizzazione e osservazione . . . . . . . . . . . . . . . . . . . . . . . 14 

2.1.4 Esempio: il problema del venditore di giornali . . . . . . . . . . . . . . 15 

2.2 Fondamenti di Programmazione Stocastica . . . . . . . . . . . . . . . . . . . 19 

2.2.1 Esempio: financial planning and control . . . . . . . . . . . . . . . . . 20 

2.3 Programmazione Stocastica lineare a due stadi . . . . . . . . . . . . . . . . . 23 

2.4 Esempi di modelli stocastici lineari a due stadi . . . . . . . . . . . . . . . . . 24 

2.4.1 Il problema dell’azienda agricola . . . . . . . . . . . . . . . . . . . . . 24 

2.4.2 Gestione degli investimenti per un impianto di distribuzione elettrica . 28 

2.5 Programmazione stocastica lineare a due stadi con ricorsione fissa . . . . . . 31 

2.5.1 Esempio: il problema del venditore di giornali . . . . . . . . . . . . . . 32 

2.6 Indicatori di validità e attendibilità della Programmazione Stocastica . . . . . 33 

2.7 Richiami sulle funzioni convesse . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

2.8 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

38

Bibliografia 

[1] M.S. Bazaraa, H.D. Sherali, C.M. Shetty, “Nonlinear Programming: Theory and 

Algorithms”, Wiley, New York, 1979. 

[2] J.R. Birge, F. Louveaux, “Introduction to Stochastic Programming”, Springer Series in 

Operations Research and Financial Engineering, Springer, Berlin, 1997. 

[3] K. Miettinen, “Nonlinear Multiobjective Optimization”, Kluwer Academic Publishers, 

Boston, 1999. 

[4] V. Pareto, “Cours d’economie Politique”, Rouge, Lausanne, Switzerland, 1896. 

39

Appunti delle Lezioni di Ottimizzazione di Sistemi ... - Iasi.cnr.it - Cnr

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?