Capitolo 2 Codifica del segnale vocale - InfoCom
Capitolo 2 Codifica del segnale vocale - InfoCom
Capitolo 2 Codifica del segnale vocale - InfoCom
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
14 CAPITOLO 2. CODIFICA DEL SEGNALE VOCALE<br />
Algoritmo di Levinson-Durbin<br />
Un efficiente algoritmo ricorsivo per il calcolo dei coefficienti ap e <strong>del</strong>la varianza σ2 v é l’algoritmo di Levinson-<br />
Durbin, qui di seguito schematicamente riportato. L’algoritmo si basa sul calcolo dei coefficienti di mo<strong>del</strong>li di<br />
ordine crescente<br />
• Inizializzazione<br />
• Mo<strong>del</strong>lo di ordine i<br />
aii = −<br />
σ 2 v0 = ˆRx(0)<br />
a11 = − ˆ Rx(1)/ ˆ Rx(0)<br />
σ 2 v1 = σ 2 v0(1 − a 2 11)<br />
ˆRx(i)+ <br />
k=1,i−1 ai−1 k ˆ Rx(i − k)<br />
σ 2 vi−1<br />
aik = ai−1 k − aii ai−1 i−k, k=1, ···i − 1<br />
σ 2 vi = σ 2 vi−1(1 − a 2 ii)<br />
(2.3.9)<br />
(2.3.10)<br />
dove con ˆ Rx(n) si sono indicati i valori stimati <strong>del</strong>l’autocorrelazione <strong>del</strong> <strong>segnale</strong> a partire dai campioni disponibili.<br />
I coefficienti aii sono anche detti coefficienti di riflessione. Un algoritmo alternativo é rappresentato dall’algoritmo<br />
di Schur, che valuta direttamente i coefficienti di riflessione aii e si presta alla realizzazione in parallelo.<br />
2.3.1 Regular Pulse Excitation- Long Term Prediction - Linear Prediction Coding<br />
La codifica RPE-LTP-LPC é adottata nel GSM e conduce ad un bit-rate di sorgente di 13Kb/s. La codifica é<br />
applicata su trame di 20 ms, corripondenti a 160 campioni estratti a 8KHz. Il filtro LPC é un filtro a soli poli<br />
<strong>del</strong>l’ottavo ordine, ed é determinato in modo da minimizzare l’energia <strong>del</strong> <strong>segnale</strong> di eccitazione mediante l’algoritmo<br />
di calcolo detto di Shur. Il <strong>segnale</strong> di eccitazione é calcolato mediante filtraggio (Short Term Filtering). Il <strong>segnale</strong><br />
cos´ ottenuto presenta una ridondanza dovuta ad una pseudoperiodicitá. Tale ridondanza é rimossa suddividendo la<br />
trama di 160 campioni in quattro blocchi (ciascuno di 40 campioni). Per ogni blocco, si individua una predizione,<br />
identificata in termini di ritardo e fattore di scala, a partire dai blocchi precedenti. Il residuo di predizione é quindi<br />
filtrato passabasso e sottocampionato di un fattore 1/3. Si sceglie una <strong>del</strong>le tre sequenze sottocampionate; poiché la<br />
fase scelta puó variare da blocco a blocco, essa é trasmessa insieme al valore di picco <strong>del</strong> residuo. Infine, le ampiezze<br />
degli impulsi residui sono codificate con tecnica ADPCM. L’allocazione dei bit fra le diversi componenti codificate<br />
é sintetizzata in Tabella 2.1. É interessante osservare che i parametri aii che descrivono il filtro LPC sono trasmessi<br />
1+aii<br />
.<br />
codificando i relativi Log Area Ratio definiti come LARii def<br />
=log 10<br />
2.3.2 Adaptive Multirate Narrowband Codec<br />
1 − aii<br />
Il codec AMR é adottato nel sistema UMTS2.8 e possiede la proprietá di consentire l’adattamento <strong>del</strong> bit-rate alla<br />
disponibilitá <strong>del</strong>le risorse di rete con un intervallo temporale di 20 ms. Il bit-rate puó variare da un massimo di<br />
2.8Al codec AMR Narrowband si affianca il codec AMR wideband, adottato per servizi di streaming e di messaggistica multimediale, che<br />
estende la banda a 507000Hz, ed opera a 9 differenti bit-rate fra i 6.6 e i 23.85 kbit/s, su campioni estratti a 16 KHz in un intervallo di 20ms.