Capitolo 2 Codifica del segnale vocale - InfoCom
Capitolo 2 Codifica del segnale vocale - InfoCom
Capitolo 2 Codifica del segnale vocale - InfoCom
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4 CAPITOLO 2. CODIFICA DEL SEGNALE VOCALE<br />
Rate Distortion function<br />
Nel contesto <strong>del</strong>la Teoria <strong>del</strong>l’informazione, la Rate distortion function si definisce come la minima informazione<br />
mutua media fra X e la sua rappresentazione ˜X = Q(X), sotto il vincolo che la distorsione media sia inferiore o<br />
al piú uguale a D, ovvero<br />
R(D) def<br />
= min<br />
Q, E{d(x,˜x)}≤D I(X, ˜X) =H(X) − H(X| ˜X)<br />
dove H(X) ha il significato di entropia nel caso di variabile aleatoria X discreta e di entropia differenziale nel<br />
caso di variabile aleatoria X continua. Per funzione di distorsione quadratica d(x, ˜x) =(x− ˜x) 2 , la rate distortion<br />
function di una variabile aleatoria Gaussiana di varianza σ2é data da:<br />
⎧<br />
⎪⎨ 1<br />
Rg(D) = 2<br />
⎪⎩<br />
log2( σ2 x<br />
D ) D ≤ σ2 x<br />
0 D ≥ σ 2 x<br />
La Rg(D) rappresenta un upper-bound per la R(D) di una v.a. di varianza σ2 . D’altro canto, é possibile derivare<br />
anche lo Shannon Lower Bound<br />
R(D) ≥ H(X) − 1<br />
2 log2 (2πeD)<br />
Lo studio puó essere esteso al caso di N v.a. Gaussiane indipendenti di varianza σ2 n,n=0,...N− 1. In tal caso,<br />
la R(D) congiunta assume la forma:<br />
Rg(θ) = <br />
<br />
max 0, 1<br />
2 log2( σ2 n<br />
θ )<br />
<br />
n=0,N−1<br />
Dg(θ) = <br />
n=0,N−1<br />
min σ 2 n,θ) <br />
Analoghe argomentazioni possono essere applicate a processi aleatori Gaussiani. Infatti, per il Teorema di Rappresentazione<br />
spettrale, un processo aleatorio stazionario Gaussiano a valor medio nullo e di densitá spettrale di<br />
potenza Px(ejω ) puó essere rappresentato come sovrapposizione di processi Gausssiani indipendenti nelle diverse<br />
bande di frequenza, e si ha<br />
<br />
Rg(θ) = max 0, 1<br />
2 log Px(e<br />
2<br />
jω <br />
)<br />
dω<br />
θ<br />
<br />
Dg(θ) = min Px(e jω ),θ dω<br />
2.2 Quantizzatore di Lloyd-Max, codifica PCM e ADPCM<br />
La quantizzazione dei valori di ampiezza <strong>del</strong> <strong>segnale</strong> introduce una distorsione media che dipende non solo dal numero<br />
di bit per campione ma anche dalla modalitá di assegnazione <strong>del</strong> valore di ampiezza ai livelli discreti ammissibili,<br />
ovvero alla scelta degli intervalli di quantizzazione <strong>del</strong> <strong>segnale</strong>.<br />
Supponiamo che la distorsione sia misurata da una funzione quadratica, e che ciascun campione sia rappresentato<br />
da b =log2Lbits. Siano qk,k=0, ···L − 1 i valori di ampiezza assumibili dalla variabile quantizzata ˜x e θk,k=<br />
0, ···L gli estremi dei corrispondenti L intervalli di decisione <strong>del</strong> quantizzatore. Il quantizzatore ottimo secondo il