Capitolo 2 Codifica del segnale vocale - InfoCom

4 CAPITOLO 2. CODIFICA DEL SEGNALE VOCALE 

Rate Distortion function 

Nel contesto della Teoria dell’informazione, la Rate distortion function si definisce come la minima informazione 

mutua media fra X e la sua rappresentazione ˜X = Q(X), sotto il vincolo che la distorsione media sia inferiore o 

al piú uguale a D, ovvero 

R(D) def 

= min 

Q, E{d(x,˜x)}≤D I(X, ˜X) =H(X) − H(X| ˜X) 

dove H(X) ha il significato di entropia nel caso di variabile aleatoria X discreta e di entropia differenziale nel 

caso di variabile aleatoria X continua. Per funzione di distorsione quadratica d(x, ˜x) =(x− ˜x) 2 , la rate distortion 

function di una variabile aleatoria Gaussiana di varianza σ2é data da: 

⎧ 

⎪⎨ 1 

Rg(D) = 2 

⎪⎩ 

log2( σ2 x 

D ) D ≤ σ2 x 

0 D ≥ σ 2 x 

La Rg(D) rappresenta un upper-bound per la R(D) di una v.a. di varianza σ2 . D’altro canto, é possibile derivare 

anche lo Shannon Lower Bound 

R(D) ≥ H(X) − 1 

2 log2 (2πeD) 

Lo studio puó essere esteso al caso di N v.a. Gaussiane indipendenti di varianza σ2 n,n=0,...N− 1. In tal caso, 

la R(D) congiunta assume la forma: 

Rg(θ) = 

 

max 0, 1 

2 log2( σ2 n 

θ ) 

 

n=0,N−1 

Dg(θ) = 

n=0,N−1 

min σ 2 n,θ) 

Analoghe argomentazioni possono essere applicate a processi aleatori Gaussiani. Infatti, per il Teorema di Rappresentazione 

spettrale, un processo aleatorio stazionario Gaussiano a valor medio nullo e di densitá spettrale di 

potenza Px(ejω ) puó essere rappresentato come sovrapposizione di processi Gausssiani indipendenti nelle diverse 

bande di frequenza, e si ha 

 

Rg(θ) = max 0, 1 

2 log Px(e 

2 

jω 

) 

dω 

θ 

 

Dg(θ) = min Px(e jω ),θ dω 

2.2 Quantizzatore di Lloyd-Max, codifica PCM e ADPCM 

La quantizzazione dei valori di ampiezza del segnale introduce una distorsione media che dipende non solo dal numero 

di bit per campione ma anche dalla modalitá di assegnazione del valore di ampiezza ai livelli discreti ammissibili, 

ovvero alla scelta degli intervalli di quantizzazione del segnale. 

Supponiamo che la distorsione sia misurata da una funzione quadratica, e che ciascun campione sia rappresentato 

da b =log2Lbits. Siano qk,k=0, ···L − 1 i valori di ampiezza assumibili dalla variabile quantizzata ˜x e θk,k= 

0, ···L gli estremi dei corrispondenti L intervalli di decisione del quantizzatore. Il quantizzatore ottimo secondo il

Previous page

Next page

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Capitolo 2 Codifica del segnale vocale - InfoCom

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?