01.07.2013 Views

Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

coseno modificada (Modified Diserte Cosine Transforrn, MDCT). Para<br />

ello se toman bloques de N muestras (N puede ser 2048 ó 256 muestras)<br />

sobrelapadas en un 50%, se les aplica una ventana cuya forma es dependiente<br />

de las condiciones de la señal de entrada, y se aplica la transformada MOCT.<br />

El modelo psicoacústico obtiene la energía máxima de la distorsión introducida en<br />

el proceso de codificación, que será enmascarada por la energía de la señal. La<br />

utilización de factores de escala permite ajustar el ruido de cuantificación en el<br />

dominio espectral.<br />

El codificador G/A se basa en dividir el espectro en varios grupos de coeficientes<br />

espectrales, llamados banda de factores de escala, que comparten un mismo<br />

factor de escala. El factor de escala representa la ganancia utilizada para<br />

modificar la amplitud de las líneas de la banda. Sobre los coeficientes<br />

transformados se realiza una codificación predictiva, con el fin de aumentar la<br />

eficiencia del codificador. Se utiliza un predictor para cada uno de los coeficientes<br />

transformados, de forma que cada predictor aprovecha la autocorrelación entre<br />

los valores de las componentes espectrales de tramas consecutivas.<br />

Este codificador incorpora un bloque TNS (Temporal Noise Shajnug) que<br />

permite controlar la estructura temporal fina del ruido de cuantificación mediante<br />

un proceso de filtrado, que incorpora las mismas herramientas de AAC <strong>MPEG</strong>-2,<br />

así como dos nuevas alternativas a la cuantificación AAC.<br />

La primera de las nuevas alternativa se denominada TwinVQ (Trcms/orm-<br />

Domain Weighled (riterieave Vector Quantizaliori, Twin.VQ).<br />

Esta herramienta permite velocidades de transmisión fijas entre 6 y 40 Kbps, y<br />

está basado en una cuantificación vectorial entrelazada1 y estimación espectral<br />

LPC. La segunda alternativa recibe el nombre de BSAC (Dit Sliced<br />

Arithmetic Coding), permite la codificación (de parámetros) sin pérdidas o<br />

codificación sin ruido "noiseless codwgr"1, de forma escalable entre 16 y 64<br />

Kbps, en pasos de 1 Kbps por canal de audio.<br />

La idea básica de estas herramientas se presenta en el Anexo D.<br />

213

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!