03.08.2013 Views

Capitolo 2 Codifica del segnale vocale - InfoCom

Capitolo 2 Codifica del segnale vocale - InfoCom

Capitolo 2 Codifica del segnale vocale - InfoCom

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4 CAPITOLO 2. CODIFICA DEL SEGNALE VOCALE<br />

Rate Distortion function<br />

Nel contesto <strong>del</strong>la Teoria <strong>del</strong>l’informazione, la Rate distortion function si definisce come la minima informazione<br />

mutua media fra X e la sua rappresentazione ˜X = Q(X), sotto il vincolo che la distorsione media sia inferiore o<br />

al piú uguale a D, ovvero<br />

R(D) def<br />

= min<br />

Q, E{d(x,˜x)}≤D I(X, ˜X) =H(X) − H(X| ˜X)<br />

dove H(X) ha il significato di entropia nel caso di variabile aleatoria X discreta e di entropia differenziale nel<br />

caso di variabile aleatoria X continua. Per funzione di distorsione quadratica d(x, ˜x) =(x− ˜x) 2 , la rate distortion<br />

function di una variabile aleatoria Gaussiana di varianza σ2é data da:<br />

⎧<br />

⎪⎨ 1<br />

Rg(D) = 2<br />

⎪⎩<br />

log2( σ2 x<br />

D ) D ≤ σ2 x<br />

0 D ≥ σ 2 x<br />

La Rg(D) rappresenta un upper-bound per la R(D) di una v.a. di varianza σ2 . D’altro canto, é possibile derivare<br />

anche lo Shannon Lower Bound<br />

R(D) ≥ H(X) − 1<br />

2 log2 (2πeD)<br />

Lo studio puó essere esteso al caso di N v.a. Gaussiane indipendenti di varianza σ2 n,n=0,...N− 1. In tal caso,<br />

la R(D) congiunta assume la forma:<br />

Rg(θ) = <br />

<br />

max 0, 1<br />

2 log2( σ2 n<br />

θ )<br />

<br />

n=0,N−1<br />

Dg(θ) = <br />

n=0,N−1<br />

min σ 2 n,θ) <br />

Analoghe argomentazioni possono essere applicate a processi aleatori Gaussiani. Infatti, per il Teorema di Rappresentazione<br />

spettrale, un processo aleatorio stazionario Gaussiano a valor medio nullo e di densitá spettrale di<br />

potenza Px(ejω ) puó essere rappresentato come sovrapposizione di processi Gausssiani indipendenti nelle diverse<br />

bande di frequenza, e si ha<br />

<br />

Rg(θ) = max 0, 1<br />

2 log Px(e<br />

2<br />

jω <br />

)<br />

dω<br />

θ<br />

<br />

Dg(θ) = min Px(e jω ),θ dω<br />

2.2 Quantizzatore di Lloyd-Max, codifica PCM e ADPCM<br />

La quantizzazione dei valori di ampiezza <strong>del</strong> <strong>segnale</strong> introduce una distorsione media che dipende non solo dal numero<br />

di bit per campione ma anche dalla modalitá di assegnazione <strong>del</strong> valore di ampiezza ai livelli discreti ammissibili,<br />

ovvero alla scelta degli intervalli di quantizzazione <strong>del</strong> <strong>segnale</strong>.<br />

Supponiamo che la distorsione sia misurata da una funzione quadratica, e che ciascun campione sia rappresentato<br />

da b =log2Lbits. Siano qk,k=0, ···L − 1 i valori di ampiezza assumibili dalla variabile quantizzata ˜x e θk,k=<br />

0, ···L gli estremi dei corrispondenti L intervalli di decisione <strong>del</strong> quantizzatore. Il quantizzatore ottimo secondo il

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!