Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

More documents

Recommendations

Info

La figura 3.57 ilustra un diagrama de bloques general de un codificador de audio general. El diagrama de bloques incluye dos bloques adicionales LTP y PNS. MODELO PS1COACUSTICO SEÑAL OE ENTRADA BANCO DE FILTROS AACMDCT TNSAAC LTP CUANT1F1CAC1ÓN Y CODIFICACIÓN BSAC I Í J I AAC+ TwinVQ STREAM LTP: PflHIlCTOR A LARGO PLAZO < LOHG TERM PRSIICTOR) PUS : SUSTITUCIÓN DE RUDO PCRCEPTUAL< Pf RCEPTUAL HOISE SUS8TITUTIOH) Fuente: hlfp.VAvww. iis.jraunhofer. de/amm/techinf/mpeg4_soft/index. html Figura 3.57 Diagrama de bloques del codificador G/A. LTP (Long term prediction, LTP) es una herramienta eficiente, introducida por MPEG-4, para reducir la redundancia de una señal entre cuadros codificados sucesivos. Esta herramienta es especialmente eficaz para las partes de una señal que tienen características claras de pitch. El bloque PNS (Perceptrial Noise SubstiLution) es una característica que se orienta a una optimización de la eficiencia de transmisión para las velocidades mas bajas. Se basa en la observación de que un "ruido suena como otro". En 214 lugar de transmitir los componentes espectrales de una señal ruidosa, únicamente
se señala en el stream de bits que una región espectral es como "ruido", incluyendo información adicional que indique la energía total en esa región. De esta manera se evita la asignación de bits para este tipo de valores espectrales. 3.3.2 HERRAMIENTAS DE CODIFICACIÓN DE AUDIO SINTÉTICO. MPEG-4 provee compresión, representación y transmisión de sonidos sintéticos y la combinación de sonidos naturales y sintéticos dentro de pistas de sonido híbridas. A través de las herramientas de audio MPEG-4 se proveen capacidades avanzadas para la transmisión de sonidos a bajas velocidades de transmisión, así como interactividad con escenas que contengan sonido. A diferencia de la codificación de audio natural, que usa modelos basados en la percepción (modelos perceptuales) para comprimir el audio natural, en la codificación de audio sintético se emplean modelos específicos para transmitir descripciones de sonido. Las descripciones son recibidas en el terminal de decodificación y convertidas en sonido a través de síntesis de sonido en tiempo real. 3.3.2.1 Voz humana sintetizada. El sistema de conversión de texto a voz (Text-to-speech,, TTS), definido por MPEG-4, genera sonidos de voz de acuerdo a un texto dado. Los sistemas TTS típicamente consisten de múltiples módulos de procesamiento, como se muestra en la figura 3.58. Los sistemas aceptan texto como entrada y generan la correspondiente secuencia de fonemas. Los fonemas son las unidades más pequeñas del lenguaje humano; cada fonema corresponde a un sonido utilizado en la voz. Un conjunto de alrededor 120 fonemas, es suficiente para describir todo el lenguaje humano. La secuencia de fonemas se usa para generar una secuencia de voz básica sin prosodia, que es, sin tono (pitch), sin duración, y sin variaciones de amplitud. De forma paralela, un módulo de entendimiento de texto analiza la entrada para 3.3.2.1.1 La interfaz Texto a Voz MPEG-4 (Interface Text-to-Speech, TTSI). El TTSI MPEG-4 es definido para que la voz pueda ser transmitida como un stream de bits que contenga texto. 215
Page 1 and 2:
ESCUELA POLITÉCNICA NACIONAL ESCUE
Page 3 and 4:
CERTIFICACIÓN Certifico que ei pre
Page 5 and 6:
DEDICATORIA A la memoria de mi padr
Page 7 and 8:
1.3.6.3 Funcionalidades de audio 37
Page 9 and 10:
2.9 ENTREGA DE STREAMS ELEMENTALES
Page 11 and 12:
CAPÍTULO 4 224 4 APLICACIONES Y CO
Page 13 and 14:
CAPÍTULO 1 ÍNDICE DE FIGURAS. Fig
Page 15 and 16:
Figira 3.5 Ejemplo de decodificaci
Page 17 and 18:
Figura 4.5 Programa de TV creado co
Page 19 and 20:
RESUMEN Luego del éxito alcanzado
Page 21 and 22:
Capítulo VISIÓN GENERAL DE MPEG-4
Page 23 and 24:
Por ejemplo, en aplicaciones de rea
Page 25 and 26:
Requerimientos para Sistemas 1 Prio
Page 27 and 28:
1 Requerimientos de objetos de audi
Page 29 and 30:
esultados deportivos o las cotizaci
Page 31 and 32:
Reportes Técnicos (TR). Son docume
Page 33 and 34:
compatible con la Versión 1, la Ve
Page 35 and 36:
con parámetros de animación, mien
Page 37 and 38:
Datos/control downstream muttiplexa
Page 39 and 40:
Escena i i I I fondo b*bk pez ufana
Page 41 and 42:
mismas que tienen que ser decodific
Page 43 and 44:
parte relativa a Sistemas de MPEG-4
Page 45 and 46:
El estándar MPEG-4 consiste en una
Page 47 and 48:
El acceso aleatorio del contenido e
Page 49 and 50:
* Definición y codificación de lo
Page 51 and 52:
En la figura 1.11 se puede observar
Page 53 and 54:
naturales a sonidos sintéticos. En
Page 55 and 56:
desean usar el sistema de control d
Page 57 and 58:
final. El estándar define un conju
Page 59 and 60:
Interacción en el lado del cliente
Page 61 and 62:
Con el objetivo de aislar el diseñ
Page 63 and 64:
23 MODELO DEL DECODIFICADOR DE SIST
Page 65 and 66:
El DAI proporciona AUs al buffer de
Page 67 and 68:
como la programación de la transmi
Page 69 and 70:
i Descriptor de Objeto ] Descriptor
Page 71 and 72:
Disscriptor de Objeto /*" r Descrip
Page 73 and 74:
Descriptor Confla. Decodtf Dracript
Page 75 and 76:
2-4.4 RELACIÓN Y ÁMBITO DE BIFS Y
Page 77 and 78:
•" Descriptor de Objeto Inicial D
Page 79 and 80:
- Descriptor de objeto inicial Desc
Page 81 and 82:
indicaciones permiten que el termin
Page 83 and 84:
elemental que contenga la informaci
Page 85 and 86:
descriptor de objeto que indique qu
Page 87 and 88:
A continuación se presenta un ejem
Page 89 and 90:
2.5.4.4.1 Tipos de Comandos BIFS. L
Page 91 and 92:
alrededor de él (CV). El comando d
Page 93 and 94:
La Figura 2.21 ilustra el uso de lo
Page 95 and 96:
un nodo específico, el nodo Quanti
Page 97 and 98:
máscara elemental asociada. En el
Page 99 and 100:
2.5.7 batos Dccodificodor Aritméti
Page 101 and 102:
2.7 SINCRONIZACIÓN DE STREAMS (SYN
Page 103 and 104:
ase a la sincronización de unidade
Page 105 and 106:
La herramienta FlexMux proporciona
Page 107 and 108:
2.9 ENTREGA DE S TREA MS ELEMENTALE
Page 109 and 110:
elementos de la parte superior de f
Page 111 and 112:
epresenta la frontera entre tareas
Page 113 and 114:
Streams empaquetados MPEG 4 Canal d
Page 115 and 116:
la comunidad MPEG-4. El software IM
Page 117 and 118:
muestras de audio. Los media data p
Page 119 and 120:
2.12.1 XMT-A. El XMT-A es una versi
Page 121 and 122:
• Corrección 1 a la primera edic
Page 123 and 124:
Partes 1, 2, 3 y 10 son independien
Page 125 and 126:
Versión 2.- Simple avanzado en tie
Page 127 and 128:
de transmisión de hasta 2 Mbps, co
Page 129 and 130:
Grafo de escena Completa.- Provee u
Page 131 and 132:
Principal.- Añade soporte para cod
Page 133 and 134:
Posteriormente, en los amendment 3
Page 135 and 136:
Audio Natural.- Contiene todas la h
Page 137 and 138:
de secuencias de video con objetos
Page 139 and 140:
Secuencia de objeto* vituale* Obje
Page 141 and 142:
3.1.1.2 Modelo del codificador MPEG
Page 143 and 144:
\ dt acotación Fuente: Documento 1
Page 145 and 146:
El estándar MPEG-4, en su parte de
Page 147 and 148:
MB Opaco M»crot>4oque «ttuwfto en
Page 149 and 150:
cada BAB, excepto para aquellos blo
Page 151 and 152:
Codificación aritmética basada en
Page 153 and 154:
a) En la construcción del contexto
Page 155 and 156:
En la fórmula anterior el rango de
Page 157 and 158:
3.1.1.5.2 Equiparación de bloques
Page 159 and 160:
Cada vector proporciona una estimac
Page 161 and 162: sobre bloques de 16x16, mientras qu
Page 163 and 164: MPEG-4 en su Versión 2 incluye la
Page 165 and 166: La cuantificación se realiza de la
Page 167 and 168: predicción es adaptiva y se selecc
Page 169 and 170: ecorrido vertical alterno; cuando s
Page 171 and 172: VLC CODE 0000 0101 OlOOs 0100 lOs 0
Page 173 and 174: 3.1.1.6.8 Texturas estáticas. Una
Page 175 and 176: una escala ordinaria y sus descendi
Page 177 and 178: mismos que para las componentes de
Page 179 and 180: Esto hace posible mejorar la calida
Page 181 and 182: 3.1.1.8 Tolerancia a fallos. Esta f
Page 183 and 184: eferidos como puntos de nodo (node
Page 185 and 186: de los puntos de nodo. Asi pues, lo
Page 187 and 188: Cuantificacion de Coordenada Decodi
Page 189 and 190: La figura 3.45 muestra el nodo supe
Page 191 and 192: tal como: coordenadas, color, norma
Page 193 and 194: 3.2.2.1 Animación facial. Las repr
Page 195 and 196: MPEG-4 especifica un modelo facial
Page 197 and 198: animación facial. Un valor FAP, pa
Page 199 and 200: •• 1 2 3 4 5 6 Número de Víse
Page 201 and 202: puede producir animación. En cambi
Page 203 and 204: conectividad). Se especifican dos t
Page 205 and 206: 3.3.1 HERRAMIENTAS DE CODIFICACIÓN
Page 207 and 208: TTS Salames Telefonía celular Inte
Page 209 and 210: 3.3.1.3.2 Líneas individuales y ar
Page 211: coseno modificada (Modified Diserte
Page 215 and 216: La figura 3.59 indica los bloques n
Page 217 and 218: El proceso de creación del sonido
Page 219 and 220: espacialización tridimensional y u
Page 221 and 222: Capítulo APLICACIONES Y COMPARACI
Page 223 and 224: Por otra parte, en el set top box M
Page 225 and 226: 4.1.1.2 Ejemplo de acceso condicion
Page 227 and 228: TVML cubre los siguientes puntos: c
Page 229 and 230: video. Esto se puede lograr realiza
Page 231 and 232: A través de MPEG-4, que permite la
Page 233 and 234: transparente. Este tipo de aplicaci
Page 235 and 236: Pilar Romano Plaza principal de la
Page 237 and 238: mismo (ver figura 4.11). La aplicac
Page 239 and 240: través de la escena, activar event
Page 241 and 242: MPEG-4 define un formato textual pa
Page 243 and 244: 4. Dentro del proceso de codificaci
Page 245 and 246: MPEG-4 soporta la codificación de
Page 247 and 248: herramienta de sustitución de ruid
Page 249 and 250: MF»EG-2 T MPEG-1 1 Parftmetra J Ba
Page 251 and 252: Partido* Característica tfofor áv
Page 253 and 254: El codificador 3ivx de la compañí
Page 255 and 256: Origwi: |Íngt\Sartiago Moffovej(AE
Page 257 and 258: Las figuras 4.21, 4.22 y 4.23 ilust
Page 259 and 260: Capítulo CONCLUSIONES Y RECOMENDAC
Page 261 and 262: textual, proporcionando así intero
Page 263 and 264:
ANEXO A: NODOS BIFS MPEG-4 En este
Page 265 and 266:
B PERFILES Y NIVELES EN MPEG-4. MPE
Page 267 and 268:
Herramientas gráficas (= Nodos BIF
Page 269 and 270:
B.2.3 PERFIL DE DESCRIPTOR DE OBJET
Page 271 and 272:
MPEG-4 Visual Tools used by Visual
Page 273 and 274:
B.4 PERFILES Y NIVELES DE AUDIO EN
Page 275 and 276:
La tabla B.7 entrega un listado de
Page 277 and 278:
El proceso consiste en la agrupaci
Page 279 and 280:
ser llamado "centroide". El conjunt
Page 281 and 282:
REFERENCIAS BIBLIOGRÁFICAS. 1. "MP
Page 283:
Software MPEG-4 • http://www.appl
show all

Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?