12 CAPITOLO 2. CODIFICA DEL SEGNALE VOCALE In primo luogo il <strong>segnale</strong> <strong>vocale</strong> presenta, su intervalli temporali <strong>del</strong>’ordine di 10, 20, 30 ms, caratteristiche spettrali quasi stazionarie e prevalente concentrazione <strong>del</strong>l’energia intorno ad un numero limitato di frequenze. Infatti, il <strong>segnale</strong> é formato nelle cavitá risonanti <strong>del</strong> cavo orale e nasale a partire dal flusso d’aria proveniente dai polmoni attraverso le corde vocali. Nell’osservazione di una finestra temporale di <strong>segnale</strong> di circa 20 ms, l’andamento spettrale osservato presenta un insieme di picchi, mo<strong>del</strong>labili come l’uscita di un filtro, opportunamente eccitato da un <strong>segnale</strong> di ingresso. Per questioni di natura computazionale, il filtro é di solito descritto come un filtro a soli poli. In secondo luogo, l’orecchio umano puó percepire come intellegibile, accettabile o anche soddisfacente una rappresentazione <strong>del</strong> <strong>segnale</strong> <strong>vocale</strong> che, mimando il mo<strong>del</strong>lo di formazione <strong>del</strong> <strong>segnale</strong> stesso, ne riproduca le caratteristiche spettrali a breve termine. Pertanto, nella rappresentazione <strong>del</strong> <strong>segnale</strong> come uscita di un filtro, il <strong>segnale</strong> di ingresso attuale puó essere rappresentato in forma variamente approssimata, dando luogo a diversi livelli di qualitá. Adottando tali principi per la codifica <strong>del</strong> <strong>segnale</strong>, i parametri codificati saranno costituiti dalla descrizione dei parametri <strong>del</strong> filtro e <strong>del</strong>la versione approssimata <strong>del</strong> <strong>segnale</strong> di ingresso. In linea di principio, l’informazione piú sensibile é costituita dai parametri che descrivono il filtro, che influiscono maggiormente sulla resa <strong>del</strong> <strong>segnale</strong> ricostruito. Dati i campioni xn <strong>del</strong> <strong>segnale</strong> da codificare, essi sono rappresentati tramite il seguente mo<strong>del</strong>lo di generazione xn = − P i=1 aixn−i + vn (2.3.5) dove i coefficienti ai sono scelti in modo da riprodurre i picchi spettrali <strong>del</strong> <strong>segnale</strong> xn, e si calcolano in funzione dei valori <strong>del</strong>l’autocorrelazione <strong>del</strong>la sequenza xn Rx[i] =E{xnxn−i}. Il termine vn rappresenta il <strong>segnale</strong> di eccitazione <strong>del</strong> filtro che genera xn. Ai fini <strong>del</strong> calcolo dei coefficienti ai, si ipotizza in primo luogo che il <strong>segnale</strong> di generazione vn sia costituito da una serie bianca, ovvero E {vnvn−k} = σ2 vδk; il mo<strong>del</strong>lo in (2.3.6) prende il nome di mo<strong>del</strong>lo Autoregressivo, e la sequenza di campioni xn é detta serie aleatoria autoregressiva (AR) Serie aleatoria autoregressiva Si dice serie aleatoria autoregressiva (AR) una serie aleatoria osservata all’uscita di un filtro a soli poli quaando all’ingresso é applicato un rumore bianco. Una serie aleatoria AR xn é pertanto descritta da una equazione alle differenze finite P xn = − (2.3.6) i=1 aixn−i + vn con E {vnvn−k} = σ2 vδk. La autocorrelazione di una serie AR soddisfa un’equazione analoga a quella di generazione <strong>del</strong>la serie AR. Lo spettro di densitá di potenza di una serie AR é esprimibile come Px(e jω )= σ 2 v |1+ P k=1 ake jωk | 2 I parametri ak,k =1, ···P governano la posizione dei P picchi di Px(ejω ) in [−π, π)]. In definitiva, la serie aleatoria AR costituisce un mo<strong>del</strong>lo matematico potente e compatto, governato cioé da un numero di parametri limitato, ovvero i coefficienti ai, i=1, ···P e la varianza σ2 v. Tale mo<strong>del</strong>lo consente di valutare analiticamente i coefficienti ai, che influenzano direttamente i picchi spettrali <strong>del</strong> filtro, in funzione <strong>del</strong>la autocorrelazione <strong>del</strong>la sequenza xn. Una volta ricavati i valori ai, sotto questa ipotesi
2.3. CODIFICA BASATA SU MODELLI 13 semplificativa, la codifica basata su mo<strong>del</strong>li opera una rappresentazione piú appropriata <strong>del</strong> <strong>segnale</strong> vn. I diversi algoritmi di codifica basata su mo<strong>del</strong>li adottano rappresentazioni differenti di tale <strong>segnale</strong>. L’equazione di generazione <strong>del</strong> mo<strong>del</strong>lo AR consente di esprimere i coefficienti di autocorrelazione <strong>del</strong>la sequenza xn in funzione dei coefficienti ai, i=1, ···P ovvero E {xnxn−k} = − Rx[k] =− P aiE {xn−ixn−k} +E{vnxn−k} i=1 P i=1 Rx[k] =Rx[−k],k