Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

More documents

Recommendations

Info

La herramienta TTSI de MPEG-4 es una interfaz TTS escalable híbrido - multinivel considerado como un conjunto más poderoso que la infraestructura TTS convencional. EL TTSI extendido puede añadir información de prosodia tomada de la voz natural, además de la entrada de texto. La interfaz y su formato de stream de bits son altamente escalables en términos de ésta información añadida; por ejemplo, si algunos parámetros de la información de prosodia no están disponibles, el decodíficador puede generar los parámetros que faltan siguiendo determinada regla. Los algoritmos para síntesis de voz y para conversión de texto a fonemas no son normativos en MPEG-4. El TTSI de MPEG-4 tiene importantes funcionalidades como un codificador individual y como sincronizador con las técnicas de animación facial. Como un codificador autosuficiente, el formato del strea-m de bits provee enlaces para controlar el lenguaje que está siendo transmitido, el género, la edad del locutor, la velocidad de hablado y la prosodia de la voz. En algunas ocasiones se puede enviar un siream de bits que contenga solo texto que será convertido a voz. En este caso el sintetizador añadirá a la voz sintetizada prosodia predefinida o generados por una regla. La voz sintetizada con prosodia predefinida entregará contenido emocional al oyente. Por otro lado, se puede enviar un stream. de bits que contenga texto, así como la prosodia detallada de la voz original, como por ejemplo: secuencia de fonemas, duración de cada fonema, frecuencia base (pitch) de cada fonema, y la energía de cada fonema. La voz sintetizada en este caso será muy similar a la voz original ya que emplea la prosodia original. 3.3,2.1.2 Proceso de Decodificación TTSI MPEG-4 La arquitectura del decodificador puede ser vista como una colección de interfaces. El comportamiento normativo del TTSI de MPEG-4 es descrito en términos de estas interfaces, no del sonido o animación que estos producen. 217
La figura 3.59 indica los bloques necesarios para la decodificación de TTSI; un demultiplexor, un decodificador, y un sintetizador proporcionan la señal de audio decodificada. Un convertidor de fonemas a parámetros FAP, un decodificador de cara, mas los elementos anteriores generan el diseño facial, que junto con la señal de audio se incorporan en el compositor para presentar una escena con animación facial y voz sintetizada. Demux Decodlflcadoi ae sintaxis ip Convertidor de fonemas - FAP bw w 1r ftnteOzador TT8 DecodMcador Pacto» > , audio outjtut faé OUtpU! 1 Compositor Fuente: http://leonardo.telecomitalialab.com/lcjfiles/mpeg-4. Figura 3.59 Visión global de proceso de decodificación del TTSI MPEG-4. 3.3.2.2 Audio estructurado MPEG-4. MPEG-4 no estandariza un conjunto de métodos particulares de síntesis, sino un método para describir maneras de sintetizar. Por tanto, cualquier método actual o futuro podrá ser descrito mediante MPEG-4. Existen algunos elementos fundamentales dentro del concepto denominado audio estructurado: 218
Page 1 and 2:
ESCUELA POLITÉCNICA NACIONAL ESCUE
Page 3 and 4:
CERTIFICACIÓN Certifico que ei pre
Page 5 and 6:
DEDICATORIA A la memoria de mi padr
Page 7 and 8:
1.3.6.3 Funcionalidades de audio 37
Page 9 and 10:
2.9 ENTREGA DE STREAMS ELEMENTALES
Page 11 and 12:
CAPÍTULO 4 224 4 APLICACIONES Y CO
Page 13 and 14:
CAPÍTULO 1 ÍNDICE DE FIGURAS. Fig
Page 15 and 16:
Figira 3.5 Ejemplo de decodificaci
Page 17 and 18:
Figura 4.5 Programa de TV creado co
Page 19 and 20:
RESUMEN Luego del éxito alcanzado
Page 21 and 22:
Capítulo VISIÓN GENERAL DE MPEG-4
Page 23 and 24:
Por ejemplo, en aplicaciones de rea
Page 25 and 26:
Requerimientos para Sistemas 1 Prio
Page 27 and 28:
1 Requerimientos de objetos de audi
Page 29 and 30:
esultados deportivos o las cotizaci
Page 31 and 32:
Reportes Técnicos (TR). Son docume
Page 33 and 34:
compatible con la Versión 1, la Ve
Page 35 and 36:
con parámetros de animación, mien
Page 37 and 38:
Datos/control downstream muttiplexa
Page 39 and 40:
Escena i i I I fondo b*bk pez ufana
Page 41 and 42:
mismas que tienen que ser decodific
Page 43 and 44:
parte relativa a Sistemas de MPEG-4
Page 45 and 46:
El estándar MPEG-4 consiste en una
Page 47 and 48:
El acceso aleatorio del contenido e
Page 49 and 50:
* Definición y codificación de lo
Page 51 and 52:
En la figura 1.11 se puede observar
Page 53 and 54:
naturales a sonidos sintéticos. En
Page 55 and 56:
desean usar el sistema de control d
Page 57 and 58:
final. El estándar define un conju
Page 59 and 60:
Interacción en el lado del cliente
Page 61 and 62:
Con el objetivo de aislar el diseñ
Page 63 and 64:
23 MODELO DEL DECODIFICADOR DE SIST
Page 65 and 66:
El DAI proporciona AUs al buffer de
Page 67 and 68:
como la programación de la transmi
Page 69 and 70:
i Descriptor de Objeto ] Descriptor
Page 71 and 72:
Disscriptor de Objeto /*" r Descrip
Page 73 and 74:
Descriptor Confla. Decodtf Dracript
Page 75 and 76:
2-4.4 RELACIÓN Y ÁMBITO DE BIFS Y
Page 77 and 78:
•" Descriptor de Objeto Inicial D
Page 79 and 80:
- Descriptor de objeto inicial Desc
Page 81 and 82:
indicaciones permiten que el termin
Page 83 and 84:
elemental que contenga la informaci
Page 85 and 86:
descriptor de objeto que indique qu
Page 87 and 88:
A continuación se presenta un ejem
Page 89 and 90:
2.5.4.4.1 Tipos de Comandos BIFS. L
Page 91 and 92:
alrededor de él (CV). El comando d
Page 93 and 94:
La Figura 2.21 ilustra el uso de lo
Page 95 and 96:
un nodo específico, el nodo Quanti
Page 97 and 98:
máscara elemental asociada. En el
Page 99 and 100:
2.5.7 batos Dccodificodor Aritméti
Page 101 and 102:
2.7 SINCRONIZACIÓN DE STREAMS (SYN
Page 103 and 104:
ase a la sincronización de unidade
Page 105 and 106:
La herramienta FlexMux proporciona
Page 107 and 108:
2.9 ENTREGA DE S TREA MS ELEMENTALE
Page 109 and 110:
elementos de la parte superior de f
Page 111 and 112:
epresenta la frontera entre tareas
Page 113 and 114:
Streams empaquetados MPEG 4 Canal d
Page 115 and 116:
la comunidad MPEG-4. El software IM
Page 117 and 118:
muestras de audio. Los media data p
Page 119 and 120:
2.12.1 XMT-A. El XMT-A es una versi
Page 121 and 122:
• Corrección 1 a la primera edic
Page 123 and 124:
Partes 1, 2, 3 y 10 son independien
Page 125 and 126:
Versión 2.- Simple avanzado en tie
Page 127 and 128:
de transmisión de hasta 2 Mbps, co
Page 129 and 130:
Grafo de escena Completa.- Provee u
Page 131 and 132:
Principal.- Añade soporte para cod
Page 133 and 134:
Posteriormente, en los amendment 3
Page 135 and 136:
Audio Natural.- Contiene todas la h
Page 137 and 138:
de secuencias de video con objetos
Page 139 and 140:
Secuencia de objeto* vituale* Obje
Page 141 and 142:
3.1.1.2 Modelo del codificador MPEG
Page 143 and 144:
\ dt acotación Fuente: Documento 1
Page 145 and 146:
El estándar MPEG-4, en su parte de
Page 147 and 148:
MB Opaco M»crot>4oque «ttuwfto en
Page 149 and 150:
cada BAB, excepto para aquellos blo
Page 151 and 152:
Codificación aritmética basada en
Page 153 and 154:
a) En la construcción del contexto
Page 155 and 156:
En la fórmula anterior el rango de
Page 157 and 158:
3.1.1.5.2 Equiparación de bloques
Page 159 and 160:
Cada vector proporciona una estimac
Page 161 and 162:
sobre bloques de 16x16, mientras qu
Page 163 and 164: MPEG-4 en su Versión 2 incluye la
Page 165 and 166: La cuantificación se realiza de la
Page 167 and 168: predicción es adaptiva y se selecc
Page 169 and 170: ecorrido vertical alterno; cuando s
Page 171 and 172: VLC CODE 0000 0101 OlOOs 0100 lOs 0
Page 173 and 174: 3.1.1.6.8 Texturas estáticas. Una
Page 175 and 176: una escala ordinaria y sus descendi
Page 177 and 178: mismos que para las componentes de
Page 179 and 180: Esto hace posible mejorar la calida
Page 181 and 182: 3.1.1.8 Tolerancia a fallos. Esta f
Page 183 and 184: eferidos como puntos de nodo (node
Page 185 and 186: de los puntos de nodo. Asi pues, lo
Page 187 and 188: Cuantificacion de Coordenada Decodi
Page 189 and 190: La figura 3.45 muestra el nodo supe
Page 191 and 192: tal como: coordenadas, color, norma
Page 193 and 194: 3.2.2.1 Animación facial. Las repr
Page 195 and 196: MPEG-4 especifica un modelo facial
Page 197 and 198: animación facial. Un valor FAP, pa
Page 199 and 200: •• 1 2 3 4 5 6 Número de Víse
Page 201 and 202: puede producir animación. En cambi
Page 203 and 204: conectividad). Se especifican dos t
Page 205 and 206: 3.3.1 HERRAMIENTAS DE CODIFICACIÓN
Page 207 and 208: TTS Salames Telefonía celular Inte
Page 209 and 210: 3.3.1.3.2 Líneas individuales y ar
Page 211 and 212: coseno modificada (Modified Diserte
Page 213: se señala en el stream de bits que
Page 217 and 218: El proceso de creación del sonido
Page 219 and 220: espacialización tridimensional y u
Page 221 and 222: Capítulo APLICACIONES Y COMPARACI
Page 223 and 224: Por otra parte, en el set top box M
Page 225 and 226: 4.1.1.2 Ejemplo de acceso condicion
Page 227 and 228: TVML cubre los siguientes puntos: c
Page 229 and 230: video. Esto se puede lograr realiza
Page 231 and 232: A través de MPEG-4, que permite la
Page 233 and 234: transparente. Este tipo de aplicaci
Page 235 and 236: Pilar Romano Plaza principal de la
Page 237 and 238: mismo (ver figura 4.11). La aplicac
Page 239 and 240: través de la escena, activar event
Page 241 and 242: MPEG-4 define un formato textual pa
Page 243 and 244: 4. Dentro del proceso de codificaci
Page 245 and 246: MPEG-4 soporta la codificación de
Page 247 and 248: herramienta de sustitución de ruid
Page 249 and 250: MF»EG-2 T MPEG-1 1 Parftmetra J Ba
Page 251 and 252: Partido* Característica tfofor áv
Page 253 and 254: El codificador 3ivx de la compañí
Page 255 and 256: Origwi: |Íngt\Sartiago Moffovej(AE
Page 257 and 258: Las figuras 4.21, 4.22 y 4.23 ilust
Page 259 and 260: Capítulo CONCLUSIONES Y RECOMENDAC
Page 261 and 262: textual, proporcionando así intero
Page 263 and 264: ANEXO A: NODOS BIFS MPEG-4 En este
Page 265 and 266:
B PERFILES Y NIVELES EN MPEG-4. MPE
Page 267 and 268:
Herramientas gráficas (= Nodos BIF
Page 269 and 270:
B.2.3 PERFIL DE DESCRIPTOR DE OBJET
Page 271 and 272:
MPEG-4 Visual Tools used by Visual
Page 273 and 274:
B.4 PERFILES Y NIVELES DE AUDIO EN
Page 275 and 276:
La tabla B.7 entrega un listado de
Page 277 and 278:
El proceso consiste en la agrupaci
Page 279 and 280:
ser llamado "centroide". El conjunt
Page 281 and 282:
REFERENCIAS BIBLIOGRÁFICAS. 1. "MP
Page 283:
Software MPEG-4 • http://www.appl
show all

Capítulo VISIÓN GENERAL DE MPEG-4 - Repositorio Digital EPN ...

Create successful ePaper yourself

Delete template?

Save as template?