30.12.2014 Views

H(z,n)

H(z,n)

H(z,n)

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

前 言<br />

第 一 部 分 : 基 本 原 理<br />

第 二 部 分 : 主 流 标 准<br />

第 三 部 分 : 技 术 分 析


音 频 编 码 的 分 类<br />

按 照 编 码 的 采 样 率 分<br />

‣ 语 音 编 码 ( 小 于 8khz)<br />

‣ 音 频 编 码 ( 大 于 8khz)<br />

按 照 编 码 的 方 法 分<br />

‣ 波 形 编 码 器<br />

‣ 感 知 编 码 器<br />

‣ 参 数 编 码 器


不 同 编 码 方 法 的 应 用<br />

波 形 编 码 器<br />

ADPCM, G.721, G.722, G.726 等<br />

特 点 : 基 于 ADPCM 编 码 . 简 单 预 测 编 码 器 .<br />

感 知 编 码 器<br />

mp2, AAC, WMA, ATRAC, AC3 等<br />

特 点 : 基 于 人 耳 建 模 , 属 于 变 换 编 码 器 . 编 码 内 核 基 于 T+SQ.<br />

应 用 : 大 于 8khz 的 音 频 编 码 .<br />

参 数 编 码 器<br />

G.723.1, G.729, G.728, CELP,AMR,EVRC 等<br />

特 点 : 基 于 人 口 建 模 , 属 于 预 测 编 码 器 . 编 码 内 核 基 于 P+VQ.<br />

应 用 : 小 于 8khz 的 语 音 编 码 .


人 耳 模 型<br />

人 耳 的 听 隔<br />

‣ sound pressure level (SPL)<br />

‣ Absolute Threshold of Hearing<br />

‣ Critical Bands<br />

‣ Simultaneous Masking<br />

‣ Non-simultaneous Masking<br />

‣ Perceptual Entropy


外 耳 中 耳 内 耳<br />

组 成 耳 翼 , 外 耳 道 , 鼓 膜 听 小 骨 半 规 管 , 前 庭 窗 , 耳 蜗<br />

作 用 1. 声 源 定 位 ,<br />

2. 放 大 20db,<br />

共 振 , 头 部 衍 射<br />

作 用 :<br />

1. 放 大 声 压 .<br />

2. 保 护 内 耳 .<br />

半 规 管 , 前 庭 窗 属 于 主 体 感 受 器 . 耳 蜗<br />

是 听 觉 受 纳 器 .<br />

基 底 膜 : 带 通 特 性


Absolute Threshold of Hearing: 一 个 纯 音 在 无 声 环 境 下 可 以 被 人 听 到 的 能 量 大 小


巴 克 谱<br />

巴 克 谱 是 根 据 人 耳<br />

的 带 通 特 性 总 结 出<br />

的 公 式 .


第 一 心 理 声 学 模 型<br />

step 1:FFT Analysis<br />

step 6:Calculation of<br />

individual masking thresholds<br />

step 2:Determination of the<br />

sound pressure level<br />

step 7:Calculation of the<br />

global masking threshold LTg<br />

step 3:Considering the<br />

threshold in quiet<br />

step 8:Determination of the<br />

minimum masking threshold<br />

step 4:Finding of tonal and<br />

non-tonal components<br />

step 9:Calculation of the<br />

signal-to-mask-ratio<br />

step 5:Decimation of tonal<br />

and non-tonal masking<br />

components


Pre-echo 的 产 生


PCM<br />

时 频 变 换 模 块<br />

其 他 处 理 模 块<br />

量 化 模 块<br />

无 损 解 码 模 块<br />

Bitstream<br />

心 理 声 学 模 型<br />

Bitstream<br />

无 损 解 码 模 块 量 化 模 块 其 他 处 理 模 块<br />

时 频 变 换 模 块<br />

PCM


MPEG1/2 AUDIO<br />

MPEG2/4 AAC<br />

MPEG4 AUDIO(1) TwinVQ, BSAC<br />

MPEG4 AUDIO(2) HE-AAC,HE-AACv2,<br />

AC3/EAC3,DTS/DTS-HD<br />

AVSA,DRA<br />

Vorbis,<br />

WMA and WMA pro<br />

Qdesign, Cook


背 景 :<br />

为 了 在 1.5Mbps 码 率 对 视 频 和 伴 音 进 行 高 质 量 压 缩 ,<br />

MPEG 于 1992 年 制 订 完 成 了 MPEG-1 标 准 ,MPEG-1 音 频<br />

编 解 码 标 准 分 为 三 层 , 复 杂 度 和 音 质 逐 层 提 高 ,MP3 即<br />

为 其 中 的 第 三 层 ,MPEG-1 layer3. 层 3 的 算 法 组 要 是 靠<br />

ASPEC 算 法 和 OCF 算 法 进 行 加 强 的 .<br />

技 术 指 标 :<br />

采 样 率 :32、44.1、48 kHz<br />

码 率 :32kbps-160kbps/ 声 道<br />

声 道 : 单 声 道 、 立 体 声


编 码 器 技 术 框 架<br />

层 1/ 层 2 编 码 器<br />

层 3 编 码 器


Layer 1 and 2 技 术 特 点<br />

IS+MS<br />

PQF<br />

SQ<br />

Bit Allocation<br />

Scalefactor 解 码<br />

Huffman 解 码<br />

反 量 化<br />

• Layer 3 技 术 特 点<br />

IS+PQF<br />

PQF+MDCT<br />

SQ<br />

Huffman Coding<br />

mp3 比 特<br />

流 输 入<br />

Header 解<br />

析 与 解 码<br />

bit stream<br />

格 式 info<br />

REORDER<br />

立 体 声 解 码<br />

Alias cancellation<br />

IMDCT<br />

分 析 子 带 滤 波 器<br />

输 出 PCM 数 据


Scalefactor<br />

Part2_length<br />

576 个 频 率 线 的 huffman 码 字<br />

子 区 0 子 区 1 子 区 2 1 or 0<br />

Big value<br />

Count1<br />

Part3_length<br />

Part2_3_length<br />

0000000<br />

Zero 区<br />

无 损 解 码 模 块<br />

层 1/2 采 用 定 长 位 分 配 指 示 方<br />

法 对 残 差 谱 线 进 行 编 码 . 解 码 时 , 通<br />

过 获 得 每 个 采 样 的 编 码 位 宽 , 依 次<br />

读 取 码 流 中 码 字 . 完 成 解 码 .L2 和 L1<br />

不 同 的 是 , 层 二 对 3 个 数 据 进 行 打 包<br />

处 理 , 每 3 个 残 差 谱 线 分 成 一 组 , 统<br />

一 编 码 . 而 L3 只 对 spectral 使 用 了<br />

huffman 编 码 的 方 法 对<br />

scalefactor 使 用 定 长 码 编 码 .


• 量 化 模 块<br />

MPEG1/2 Audio 编 码 端 通 过 在 每 个 子 带 中 取 一 个 scalerfactor, 并 始 每 个<br />

谱 线 都 除 以 scalefactor 减 小 谱 线 的 动 态 幅 值 范 围 , 降 低 量 化 噪 声 , 并 且 使 用<br />

非 均 匀 量 化 进 一 步 减 小 频 率 谱 线 的 幅 值 , 便 于 进 行 huffman 编 码 时 减 小 码 表 。<br />

所 以 解 码 中 反 量 化 模 块 由 2 级 组 成 , 一 级 残 差 谱 反 量 化 , 一 级 是 sfb 反 量 化 .<br />

反 量 化<br />

Scalefactor<br />

Demux<br />

反 量 化<br />

残 差 谱 线<br />

De-scale


量 化 公 式<br />

层 1<br />

s <br />

whe re,<br />

2nb<br />

2 nb 1 * s <br />

2nb1<br />

s <br />

s <br />

nb<br />

s factor * s <br />

<br />

<br />

is the fra ctional num ber ,<br />

is the re qua ntize d value , and<br />

is the number of bits alloca te d to sa mples in the subband .<br />

s C * s D<br />

whe re,<br />

<br />

s <br />

s <br />

层 2<br />

<br />

is the fra ctional num ber , and<br />

is the re qua ntize d value .<br />

层 3<br />

(1) long block:<br />

4<br />

xr i<br />

= signis i * is 3 2 i<br />

<br />

1<br />

4<br />

global _gain[gr] - 210 - 8subblock_ gain[window][gr] <br />

scalefac _ multiplier* scalefac _ s[gr][ch ][sfb ][window]<br />

2<br />

<br />

(2) short block:<br />

4 1<br />

global _ gain[gr]- 210<br />

xr i<br />

= signis i * is 3 i<br />

*2 4<br />

<br />

<br />

<br />

scalefac _ multiplier* scalefac _ l[sfb][ch ][gr] preflag [gr]pretab[sfb]<br />

2


立 体 声 处 理 模 块<br />

MS stereo and Intensity stereo<br />

MS 和 IS 应 用 范 围


MS 立 体 在 左 右 声 道 所 传 送 的 分 别 为 middle 和 side, 要 经 过 以 下<br />

的 公 式 才 能 重 建 出 左 右 声 道 :<br />

.<br />

L i M i S i<br />

2<br />

and R i M i S i<br />

2


人 类 听 觉 系 统 一 般 对 低 频 信 号 而 言 , 其 对 信 号 的 能 量 与 相 位 皆 较<br />

敏 感 , 相 对 于 在 高 频 信 号 , 人 耳 只 对 其 能 量 较 为 敏 感 , 而 相 位 较 不<br />

敏 感 。Intensity Stereo coding 就 是 利 用 此 一 人 耳 的 特 性 , 被 使 用<br />

在 高 频 区 域 里 。<br />

其 中 is_possb 在 scale factor 中 指 定


时 频 变 换 模 块<br />

层 1/2 的 T 模 块 由 PQMF 和 WOA (window-overlapadd)<br />

组 成 . 层 3 在 进 行 PQMF 之 前 还 要 有 IMDCT 和 WOA 子<br />

模 块 .


N 1<br />

N<br />

X<br />

k<br />

xicos( ( i )(2k<br />

1))<br />

N 4<br />

i0<br />

N /21<br />

N<br />

xi<br />

X<br />

k<br />

cos( ( i )(2k<br />

1))<br />

N 4<br />

k 0<br />

<br />

<br />

MPEG1/2 Audio 都 采 用 了 一 种<br />

PQMF 变 换 进 行 时 频 分 析 . 一 帧 数<br />

据 以 12 个 样 本 为 一 组 , 层 1 有 32 个<br />

组 , 层 2,3 有 36 个 样 本 为 一 组 . 编 码<br />

时 每 帧 数 据 加 窗 和 将 采 样 后 的 数<br />

据 的 进 入 32 个 滤 波 器 , 得 到 频 域 数<br />

据 . 解 码 时<br />

Filter Bank<br />

N = 32


N-1<br />

π 1 N<br />

X<br />

k= xicos( (i+ + )(2k+1))<br />

N 2 4<br />

i=0<br />

N/2-1<br />

π 1 N<br />

x<br />

i= Xkcos( (i+ + )(2k+1))<br />

N 2 4<br />

k=0<br />

<br />

(I)MDCT<br />

层 3 在 PQMF 基 础 上 增 加 了<br />

MDCT 来 提 高 频 率 分 辨 率 . 公 式<br />

如 下 . 而 且 针 对 稳 态 帧 和 瞬 态 帧<br />

层 3 使 用 不 同 的 分 析 长 度 .<br />

N=36 长 窗<br />

12 短 窗


WOA: de-windowed<br />

<br />

层 3 使 用 正 弦 窗 . 规 定 了 4 种 窗 型 分 别 是 开 始 , 结 束 , 长 窗 和 短 窗 .<br />

层 使 用 当 前 帧 的 前 半 帧 数 据 和 前 一 帧 的 后 半 帧 数 据 叠 加 消 除 频 域 混 叠 .( 如 图 )<br />

当 使 用 短 窗 时 ,3 个 短 窗 是 在 码 流 中 是 interlace 存 储 的 . 首 先 要 进 行 解 交 织 处 理 . 处 理 方 法 如 图 .<br />

a) block_type=0 (normal window)<br />

z i x i sin <br />

i 1 36 2<br />

for i= 0 to 35<br />

d) block_type=2 (short block)<br />

j y i <br />

j xi sin<br />

<br />

12 i 1 2<br />

<br />

for i = 0 to 11, j= 0 to 2<br />

b) block_type=1 (start block)<br />

<br />

for i= 0 to 17<br />

<br />

x i sin 36 i 1 <br />

2<br />

x z i i for i=18 to 23<br />

<br />

x i sin <br />

12<br />

i 18 1 2<br />

for i= 24 to 29<br />

<br />

0 for i= 30 to 35<br />

c) block_type=3 (stop block)<br />

0 for i= 0 to 5<br />

<br />

x i sin i 6 1 12<br />

2<br />

z i<br />

for i= 6 to 11<br />

<br />

x i<br />

for i=12 to 17<br />

<br />

x i<br />

sin i 1 36<br />

2<br />

for i=18 to 35


背 景 :<br />

针 对 标 准 清 晰 度 数 字 电 视 和 高 等 清 晰 度 数 字 电 视 应 用 下 制 定 的 方<br />

案 1992 年 正 式 发 布 , 标 准 号 是 ISO/IEC13818-3. 他 能 够 提 供 CD 级 的 音<br />

质 .MPEG2 BC 是 针 对 MPEG-1 音 频 兼 容 的 多 声 道 和 低 码 率 的 扩 展 .<br />

技 术 背 景 :<br />

采 样 率<br />

: 16,22.05,24,32,44.1,48khz<br />

比 特 率 : 8~384kbps(2 声 道 )<br />

通 道<br />

: 5.1 声 道


Prediction<br />

利 用 预 测 技 术 减 少 通 道 间 冗 余 . 使 用 通 道 1 和 通 道 2 的 采 样 预 测 通 道<br />

3,4,5 的 采 样 数 据 .<br />

2<br />

<br />

T2(n) pred_ coef_ T2_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T2_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

T3(n) pred_ coef_ T3_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T3_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

T4(n) pred_ coef_ T4_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T4_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

pci<br />

0<br />

2<br />

<br />

pci<br />

0<br />

2<br />

<br />

pci<br />

0<br />

T2<br />

(n) = T2(n) - T2(n) <br />

T3<br />

(n) = T3(n) - T3(n) <br />

T4<br />

(n) = T4(n) - T4(n)


背 景<br />

1997 年 制 订 不 兼 容 MPEG-1 的 音 频 标 准 MPEG-2 NBC, 即 MPEG-2 AAC<br />

1999 年 MPEG-2 AAC 增 加 LTP 和 PNS 工 具 , 形 成 MPEG-4 AAC v1<br />

2002 年 MPEG-4 AAC v1 增 加 了 SBR 和 错 误 鲁 棒 性 工 具 , 形 成 MPEG-4 HE-AAC<br />

2004 年 MPEG-4 HE-AAC 引 入 PS 模 块 , 提 升 低 码 率 性 能 , 形 成 EAAC+<br />

技 术 指 标<br />

采 样 率 :8kHz - 96kHz<br />

码 率 : 8kbps - 576kbps<br />

声 道 : 最 多 支 持 48 个 主 声 道 ,16 个 低 频 增 强 声 道


MPEG2 AAC 技 术 特<br />

点<br />

IS+ MS+ Coupling<br />

MDCT<br />

SQ<br />

Huffman Coding<br />

GC, TNS, Prediction<br />

DRC<br />

• MPEG4 AAC 技 术 特 点<br />

MPEG2 AAC<br />

+LTP<br />

+PNS<br />

TwinVQ<br />

AAC<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

Bitstream deformater<br />

M/S<br />

PNS<br />

Prediction<br />

Intensity<br />

Coding<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Gain Control<br />

Unused features<br />

Optional features<br />

SSR<br />

LC/LD/LTP


无 损 解 码 模 块<br />

MPEG2/4 AAC 标 准 的 也 应 用 了 huffman 编 码 算 法 到 无 损 编 码 模 块 . 但 与<br />

mp3 不 同 的 是 .MPEG2 AAC 对 scalefactor 也 使 用 了 huffman 编 码 . 并 且 码<br />

本 更 加 合 理 .<br />

量 化 模 块<br />

MPEG2/4 AAC 标 准 中 的 量 化 部 分 也 是 用 了 非 均 匀 量 化 器 . 公 式 如 下 .<br />

mdct _ line sign( q( i) 0.4054)* abs( q( i) 0.4054)<br />

*2<br />

4 1<br />

( scalefactor common _ scalefac )<br />

3 4


时 频 转 换 模 块<br />

MPEG2/4 AAC 只 应 用 了 MDCT 算 法 把 时 域 数 据 转 换 到 频 域 数 据 , 没<br />

有 使 用 MP3 的 PQMF 模 块 . 而 且 ,AAC 中 一 帧 的 数 据 是 1024 个 采 样 , 并<br />

对 每 帧 的 信 号 类 型 进 行 分 析 , 分 为 和 mp3 相 似 的 4 个 类 型 编 码 , 长 窗 , 短<br />

窗 , 开 始 窗 和 结 束 窗 .AAC 长 窗 1024 个 数 据 , 短 窗 256 个 数 据 , 当 当 前 帧<br />

为 短 窗 时 , 每 帧 有 8 个 短 窗 数 据 . 而 且 在 AAC 中 , 标 准 提 供 了 2 中 基 本 窗<br />

函 数 , 一 种 是 和 mp3 一 样 的 正 弦 窗 , 一 种 是 KBD 窗 .<br />

其 他 模 块<br />

MPEG2 AAC 使 用 了 TNS 算 法 降 低 编 码 系 统 的 pre-echo 噪 音 , 使 用 了<br />

prediction 算 法 开 发 信 号 频 域 的 帧 间 特 性 , 提 高 编 码 效 率 .MPEG4<br />

AAC 使 用 了 LTP 代 替 MPEG2 AAC 的 prediction 算 法 , 力 图 在 获 得 同<br />

样 编 码 质 量 的 同 时 降 低 编 码 复 杂 度 .MPEG4 AAC 也 应 用 了 PNS 算 法<br />

提 高 系 统 对 高 频 部 分 信 号 编 码 的 质 量 .


Prediction<br />

Predictor Side Info<br />

RECONSTRUCTION CONTROL<br />

帧 间 预 测<br />

后 向 自 适 应 格 型 预 测<br />

LMS 自 适 应 原 理<br />

y i,q (n)<br />

Q i<br />

-1<br />

y i,rec (n)<br />

IF (PDP && PU)<br />

x i,rec (n) = y i,rec (n) + x i,est (n)<br />

ELSE<br />

x i,rec (n) = y i,rec (n)<br />

x i,rec (n)<br />

只 在 非 短 窗 内 使 用<br />

x i,est (n)<br />

x i,rec (n-1)<br />

应 用 单 位 为 sfb,<br />

P i<br />

z -1<br />

分 组 复 位<br />

Coeff 计 算 应 用 预 测 预 测 器 更 新


重 建 公 式<br />

x ( n) x ( n) e ( n)<br />

rec est q<br />

预 测 公 式<br />

x<br />

est<br />

( n)<br />

xest, 1(<br />

n)<br />

xest,<br />

2(<br />

n)<br />

x<br />

est<br />

, m( n)<br />

bkm(<br />

n)<br />

rq<br />

, m1(<br />

n1)<br />

r<br />

q,0(<br />

n)<br />

ax<br />

rec<br />

n<br />

r<br />

( n)<br />

a(<br />

rq<br />

,0(<br />

n1)<br />

bk1(<br />

n)<br />

eq,<br />

0(<br />

))<br />

q, 1<br />

n<br />

eq, m( n)<br />

eq,<br />

m1(<br />

n)<br />

xest,<br />

m(<br />

n)


自 适 应 公 式<br />

如 果 是 固 定 的 信 号 ( 指 有 规 则 的 周 期 的 信 号 ) 则 a = b = 1<br />

E eq, m1 ( n) rq , m1( n 1)<br />

<br />

km <br />

<br />

<br />

, m 1, 2, e<br />

2 2<br />

q,0 ( n) rq ,0( n) xrec<br />

( n)<br />

1<br />

2<br />

E <br />

eq, m1 ( n) <br />

E <br />

rq , m1( n 1)<br />

<br />

<br />

• 如 果 要 自 适 应 的 调 整 系 数 适 应 当 前 信 号 的 属 性 则<br />

k<br />

m<br />

COR<br />

( n1)<br />

<br />

VAR<br />

( n)<br />

( n)<br />

COR ( n) COR ( n 1) r ( n 1) e ( n)<br />

m m q, m1 q, m1<br />

VAR ( n) VAR ( n 1) 0.5 r ( n 1) e ( n)<br />

2 2<br />

m m q, m1 q, m1<br />

0.90625<br />

m<br />

m<br />

<br />

<br />

预 测 器 复 位<br />

Reset group number Predictors of reset group<br />

1 P0, P30, P60, P90,...<br />

2 P1, P31, P61, P91,...<br />

3 P2, P32, P62, P92,...<br />

...<br />

30 P29, P59, P89, P119,...


TNS<br />

Temporal Noise Shaping<br />

(TNS) 是 一 种 能 够 自 适 应 于<br />

入 信 号 特 性 来 降 低 pre-echo<br />

Spec data<br />

自 相 关 函<br />

数<br />

R0<br />

R(s)<br />

Levinson<br />

Durbin<br />

(order-12)<br />

/<br />

error<br />

gain<br />

Ref.coef<br />

量 化 反 射<br />

系 数<br />

Coef<br />

截 断 系 数<br />

Index, order<br />

计 算 LPC 系<br />

数<br />

效 应 的 新 技 术 。 它 利 用 应 用<br />

于 信 号 频 谱 的 处 理 来 实 现 时<br />

LPC 系 数<br />

TNS 滤 波<br />

(MA)<br />

域 噪 声 形 状 的 控 制 , 能 够 对<br />

Encode<br />

量 化 噪 声 的 细 微 时 域 结 构<br />

Decode<br />

( 甚 至 在 一 个 滤 波 器 组 窗 口<br />

内 ) 进 行 控 制 .<br />

Index,TNS<br />

order<br />

Truncate<br />

Coeffs<br />

TNS decode coeffs<br />

Compute<br />

LPC<br />

Coeffs<br />

LPC coeffs<br />

Spectral data<br />

TNS 滤 波<br />

(AR)


TNS 技 术 特 点<br />

帧 内 预 测<br />

任 意 窗 使 用<br />

L-D 算 法<br />

可 以 在 任 意 地 方 使 用 , 可 以 跨 越 SFB<br />

8 个 side info.<br />

Coeff 计 算 边 界 确 定 应 用 滤 波


Gain Conctrol 组 件 有 3 子 模 块 组 成 .<br />

(1) GC 数 据 解 析<br />

(2) GC 函 数 设 置<br />

(3) GC WOA 与 综 合


原 理 :<br />

‣ 类 音 调 信 号 与 类 噪 声 信 号 相 比 需<br />

要 更 高 的 编 码 精 度<br />

‣ Long Term Prediction 是 一 种 时<br />

域 帧 间 1 阶 前 相 自 适 应 IIR 滤 波 器 . 目<br />

的 在 于 减 少 信 号 的 时 域 帧 间 冗 余 .<br />

码 流 解 析<br />

预 测 计 算<br />

时 频 转 换<br />

LTP 模 块<br />

TNS 编 码<br />

LTP 采 样 更 新<br />

数 据 重 建<br />

TNS 解 码<br />

时 频 转 换


‣ 在 每 帧 有 一 个 ltp 参 数 , 用 ltp 参 数 查 表 可 以 得<br />

到 ltp 预 测 系 数 . 并 在 该 sfb 内 执 行 时 域 预 测 . 当<br />

前 帧 内 可 以 有 偏 移 参 数 .<br />

‣ 由 于 LTP 是 时 域 预 测 , 要 用 前 一 帧 的 时 域 数 据<br />

乘 以 预 测 系 数 得 到 当 前 预 测 值 . 再 经 过 时 频<br />

变 换 转 换 到 频 域 系 数 和 TNS 编 码 ( 如 果 使 用 )<br />

才 能 和 当 前 码 流 中 的 残 差 值 相 加 重 构 . ltp 从<br />

sfb 0 开 始 执 行 重 构 , 最 多 执 行 40 个 sfb.<br />

‣ LTP 和 PNS 不 可 同 时 使 用 , 如 果 码 流 中 同 时 标<br />

识 LTP 和 PNS 同 时 有 效 , 优 先 节 目 PNS, 不 解 码<br />

LTP.<br />

Pred_buf<br />

Est_buf<br />

T_Est_coef<br />

Sfb_coef<br />

X<br />

偏 移<br />

时 频 转 换<br />

F_Est_coef<br />

+<br />

F_Cur_coef<br />

F_Rec_coef<br />

Ltp_max_sfb


原 理 :<br />

Perceptual Noise Substitution (PNS)<br />

在 每 个 sfb 内 检 测 类 噪 声 信 号 .<br />

在 流 中 解 析 噪 声 替 代 标 志 和 替 代 信 号 带 宽 的 功 率 .<br />

解 码 器 按 照 功 率 谱 插 入 伪 随 机 矢 量 来 替 代 谱 线 信 号 .


背 景<br />

三 星 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方<br />

案 使 用 Bit Slice Arithmetic Coding 代 替 了 MPEG2 AAC 的 huffman 解 码<br />

单 元 . 该 方 案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该<br />

方 案 能 够 实 现 精 细 可 扩 展 编 码 . 被 应 用 于 T-DMB 和 S-DMB 系 统 .<br />

技 术 框 架<br />

Bitstream deformater<br />

TwinVQ<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

M/S<br />

Intensity<br />

Coding<br />

AAC<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

PNS<br />

Prediction<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Unused features<br />

Optional features<br />

Gain Control SBR PS<br />

SSR HE-AAC AAC++ LC/LD/LTP


技 术 特 点 :<br />

1. 比 特 率 可 分 级 :<br />

分 层 实 现 比 特 率 16( 基 本<br />

层 ),24,32,40,48,56,64kb<br />

ps.<br />

2. 带 宽 可 分 级 :<br />

对 每 层 , 仅 仅 受 限 的 频 率<br />

带 宽 才 被 编 码 . 每 层 的 可<br />

分 级 增 量 带 宽 是 3.5khz.


1. BSAC 的 调 整 步 长 :<br />

基 本 层 : 16k bps<br />

每 个 增 加 层 : 1 kbps<br />

2. 每 32 个 谱 线 数 据 形 成 一 个 处 理 单 元 , 有 相 同 的 算 法 编 码 模 型 索 引 . 被 称 为 codeband<br />

3. 4 维 比 特 片 矢 量 分 为 2 个 子 矢 量 ( 矢 量 0 和 矢 量 1).<br />

4. 立 体 声 编 码 和 PNS 使 用 不 同 的 编 码 模 型<br />

5. 差 分 编 码 的 Scale-factor 使 用 许 多 不 同 的 编 码 模 型 .<br />

6. 不 同 的 codeband 可 以 有 共 同 的 Scale-factor 但 是 有 不 同 的 算 术 模 型 .


背 景<br />

NTT 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方 案<br />

使 用 Twin-Vector Quant 代 替 了 MPEG2 AAC 的 huffman 解 码 单 元 . 该 方<br />

案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该 方 案 能 够<br />

实 现 精 细 可 扩 展 编 码 .<br />

技 术 框 架<br />

Bitstream deformater<br />

TwinVQ<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

M/S<br />

Intensity<br />

Coding<br />

AAC<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

PNS<br />

Prediction<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Unused features<br />

Optional features<br />

Gain Control SBR PS<br />

SSR HE-AAC AAC++ LC/LD/LTP


IMDCT<br />

Decode<br />

LPC coefficient<br />

calculation<br />

MDCT<br />

Encode<br />

TwinVQ 解 码 框 图<br />

X<br />

LPC spectrum<br />

calculation<br />

LPC cepstrum<br />

calculation<br />

LPC coefficient<br />

to<br />

LSP coefficient<br />

÷<br />

LPC cepstrum<br />

calculation<br />

Decoder<br />

LSP VQ<br />

Bark calculation<br />

X<br />

Decoder<br />

Bark VQ<br />

Bark envelope<br />

calculation<br />

÷<br />

Power<br />

calculation<br />

X<br />

Decoder<br />

Power VQ<br />

÷<br />

De-interleave<br />

Interleave<br />

Decoder<br />

Decoder<br />

Weighted<br />

VQ<br />

Weighted<br />

VQ


背 景 :<br />

HE-AACv1/v2 是 三 种 MPEG 技 术 的 整 合 体 , 包 括 高 级 音 频 编 码 (Advanced Audio<br />

Coding, AAC), 以 及 科 玎 技 术 有 限 公 司 (Coding Technologies) 的 谱 带 复 制 (Spectral<br />

Band Replication,SBR) 和 参 量 立 体 声 (Parametric Stereo,PS) 技 术 。SBR 是 一 种 独 特 的 带<br />

宽 扩 展 技 术 , 它 能 够 仅 仅 使 用 一 半 的 比 特 速 率 带 宽 来 进 行 音 频 编 解 码 , 而 传 输 质 量 却 一 致 。PS 则<br />

能 够 使 低 比 特 速 率 的 立 体 声 信 号 , 在 编 解 码 的 效 率 上 增 加 一 倍 。HE-AACv1/v2 在 许 多 的 国 际 标 准<br />

化 组 织 中 都 已 经 被 广 泛 采 用 。<br />

性 能 :<br />

• 支 持 多 声 道 5.1,7.1 以 及 更 多 ( 总 支 持 信 道 数 可 达 48)<br />

• 以 48kbps 速 率 传 输 CD 音 质 立 体 声 , 以 32kbps 速 率 传 输 准 CD 音 质 立 体 声 , 以 24kbps 速 率 传 输<br />

准 优 质 立 体 声 . 低 至 8kbps 的 速 率 单 声 道 优 化 传 输 话 音 、 话 音 / 音 乐 混 合 音 频<br />

• 遵 从 ISO/IEC 14496-3


SBR 技 术<br />

SBR 工 具 用 于 重 建 音 频 信 号 的 高 频 区 域 成 分 , 这 种 重 建 是 基 于 对<br />

在 编 码 过 程 中 被 截 断 的 谐 波 序 列 的 复 制 而 进 行 的 。SBR 首 先 对 生 成 的<br />

高 频 成 分 的 谱 包 络 进 行 调 整 , 然 后 对 经 过 调 整 的 谱 包 络 进 行 综 合 滤<br />

波 , 再 加 上 噪 声 处 理 和 正 弦 成 分 , 从 而 重 构 出 原 始 音 频 信 号 的 谱 特<br />

征 。


SBR 技 术 由 4 个 模 块 组 成<br />

分 别 是 :<br />

谱 线 解 码 模 块 .<br />

分 析 综 合 滤 波 器 模 块 .<br />

HF 产 生 模 块 .<br />

HF 调 整 模 块 .<br />

AAC Core<br />

Decoder<br />

Bitstream<br />

Payload<br />

Deformatter<br />

HE-AACv1 比 特 流<br />

Bitstream<br />

Parser<br />

Huffman<br />

Decoding &<br />

Dequantization<br />

Analysis<br />

QMF Bank<br />

HF Generator<br />

Envelope<br />

Adjuster<br />

Synthesis<br />

QMF Bank<br />

Output<br />

PCM Samples


比 特 流 输 入<br />

码 流 解 析<br />

残 差 谱 线 解 码<br />

谱 线 分 析<br />

MPEG4 AAC 解 码 器<br />

Huffman 解 码<br />

时 频 变 换 模 块<br />

反 量 化<br />

分 析 QMF<br />

X<br />

HF generation 模 块<br />

线 性 预 测<br />

XLow<br />

XHigh<br />

HF adjustment 模 块<br />

Eorig<br />

组 装 调 整<br />

XHigh<br />

Qorig<br />

加 躁<br />

W1<br />

正 弦 调 制<br />

时 频 变 换 模 块<br />

W2<br />

Y<br />

综 合 QMF<br />

时 域 PCM 信 号


时 域<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ● ● ●<br />

Huffman<br />

● 解 ●码 有 ●数<br />

●<br />

● ●<br />

据 的<br />

● ●<br />

区 域<br />

● ● ● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

频 带<br />

复 制<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 1<br />

子 带 2<br />

子 带 3<br />

子 带 4<br />

子 带 5<br />

子 带 6<br />

子 带 7<br />

子 带 8<br />

子 带 9<br />

子 带 10<br />

子 带 11<br />

子 带 12<br />

子 带 15<br />

子 带 14<br />

子 带 16<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 N-1<br />

残 差 谱 线 解 码 模 块<br />

该 模 块 实 现 确 定 非 零<br />

谱 线 位 置 和 非 零 谱 线<br />

的 解 码 . 在 确 定 非 零 谱<br />

线 位 置 , 标 准 采 取 的 方<br />

法 很 灵 活 . 在 解 码 谱 线<br />

数 据 时 依 然 采 用 差 分<br />

huffman 解 码 .<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 N<br />

频 域<br />

960samples/frame 时 N=30<br />

1024samples/frame 时 N=32


反 量 化<br />

反 量 化


QMF Analysis<br />

SBR 工 具 的 第 一 个 模 块 就 是 首 先 把 解 码<br />

后 的 时 域 数 据 转 换 到 频 域 , 这 个 功 能 是<br />

通 过 复 数 分 析 滤 波 器 组 实 现 的 . 复 数 矩<br />

阵 如 下 :


• QMF Synthesis:<br />

频 带 复 制 后 的 数 据 还 要 统 一 转 换 到<br />

时 域 . 复 数 矩 阵 如 下 :


• QMF 将 采 样 综 合<br />

SBR 内 部 还 有 一 种 子 带 综 合 模 式 ,<br />

既 是 降 采 样 综 合 , 其 变 换 矩 阵 如 下 :


HF 产 生 模 块<br />

HF 生 成 器 的 目 的 是 将 一 定 数 目<br />

的 由 从 矩 阵 XLow 的 一 些 连 续 子 带<br />

通 过 合 成 滤 波 器 组 得 到 的 子 带 信<br />

号<br />

复 制 到 矩 阵 XHigh 的 一 些 连 续 子 带<br />

中 去 。<br />

输 入 参 数 和 矢 量<br />

XLow<br />

计 算 协 方 差 矩 阵<br />

Φk(i,j)<br />

计 算 chirp factors 计 算 线 性 预 测 系 数 计 算 patch 信 息<br />

bwArray a0(k),a1(k) patchStartSubband<br />

和<br />

patchNumSubbands<br />

计 算 Xhigh 预 测 值<br />

XHigh<br />

输 出 参 数 和 矢 量


HF 产 生 模 块 公 式 推 导


EOrig<br />

QOrig<br />

谱 线 和 噪 声 地 址 映 射<br />

EOrigMapped<br />

QMapped<br />

输 入 参 数 与 矢 量<br />

Step2: 附 加 HF 信 号 计 算<br />

Generate Sinusoid<br />

Harmonic<br />

SIndexMapped<br />

Map Sinusoid<br />

Harmonic<br />

SMapped<br />

计 算 HF 信 号 的 幅 值<br />

Xhigh<br />

Estimation of current envelope<br />

Step1:Mapping<br />

Step3: 谱 线 估 计<br />

HF 调 整<br />

在 预 测 了 高 频 数 据 以 后 . 预 测 出 的 数 据<br />

和 原 始 数 据 差 异 还 有 很 大 ,HF 调 整 模 块<br />

就 是 利 用 码 流 中 的 参 数 信 息 , 解 析 出 附<br />

加 激 励 信 号 , 附 加 噪 声 信 号 和 附 加 正 弦<br />

信 号 , 再 把 这 些 信 号 值 加 到 预 测 值 上 ,<br />

近 似 还 原 得 到 原 始 高 频 数 据 .<br />

ECurr<br />

QM<br />

SM<br />

增 益 计 算<br />

Step4: 增 益 计 算<br />

SMBoost<br />

QMLimBoost<br />

GLimBoost<br />

Xhigh<br />

GLimBoost<br />

GFilt<br />

计 算 HF 信 号<br />

W<br />

1<br />

QMLimBoost<br />

参 数<br />

计 算<br />

QFilt<br />

加 躁 波<br />

W<br />

2<br />

SMBoost<br />

ΨRe<br />

加 正 弦 谐 波<br />

Step5:HF 信 号 组 装<br />

Y<br />

输 出 参 数 与 矢 量


映 射<br />

正 弦 产 生<br />

频 谱 评 定<br />

噪 声 谱 正 规 化<br />

正 弦 谱 正 规 化


增 益 计 算<br />

能 量 补 偿<br />

增 益 限 制


各 种 增 益 计 算


平 滑 滤 波


加 躁


正 弦 调 制


HF 调 整 后 得 到 的 矢 量 即 可 和 源 低 频 矢 量 合 并 ,<br />

统 一 进 入 QMF 综 合 滤 波 器 组 , 进 行 频 时 转 换 , 得<br />

到 时 域 数 据 输 出 , 完 成 解 码 过 程 .


HE-AACv2 = HE-AACv1 + Parametric<br />

stereo<br />

解 码 器 结 构 如 下<br />

HE-AACv1 解 码 器<br />

Parametric stereo<br />

MPEG4 AAC<br />

解 码 器<br />

QMF Analysis<br />

(64 bands)<br />

Other SBR Tool<br />

Hybrid<br />

analysis<br />

Delay<br />

LF<br />

HF<br />

De-correlation<br />

……s(k,n)……<br />

…d(k,n)…<br />

Stereo Processing<br />

Hybrid<br />

synthesis<br />

Hybrid<br />

synthesis<br />

QMF systhesis<br />

(64 bands)<br />

QMF systhesis<br />

(64 bands)<br />

L<br />

R


• PS<br />

PS 技 术 由 4 个 模 块 组 成 . 码 流 解 析 ,<br />

混 合 QMF 分 析 与 综 合 模 块 , 立 体 声<br />

处 理 模 块 , 解 相 关 模 块 .<br />

Low frequency filtering<br />

Sk(n)<br />

Demuxer<br />

Framing<br />

eAAC+ 码 流<br />

Stereo Processing<br />

De-correlation<br />

• PS 单 元 的 码 流 解 析 相 对 简 单 , 除<br />

了 要 解 码 出 相 应 的 定 长 sideinfo<br />

数 据 以 外 , 主 要 是 解 码 参 数 立 体<br />

声 的 4 个 参 数 iid, iic, opd 和 ipd 以<br />

及 它 们 的 位 置 信 息 . 这 4 个 参 数 都<br />

是 使 用 差 分 huffman 编 码 .<br />

Mixing<br />

Phase parameters<br />

Interpolation<br />

Hi,j(k,ne)<br />

Perform transient<br />

detection<br />

Apply transient<br />

reduction to<br />

decorrelated signal<br />

dk(z)<br />

Calculate decorrelated<br />

signal<br />

Mixing<br />

lk(n),rk(n)<br />

Hybrid QMF synthesis<br />

filterbank<br />

L,R


混 合 QMF 分 析 与 综 合 模 块<br />

对 经 过 QMF 处 理 的 频 谱 ,PS 模 块 要 做 进 一 步 谱 线 分 析 , 把 1024 个 谱 线 分 成 10,20<br />

或 34 个 子 带 . 分 组 方 式 和 公 式 如 下 , 根 据 码 流 中 不 同 的 信 息 选 择 相 应 的 QMF.


Hybrid QMF analysis filterbank for the 10 and 20 stereo-bands configuration


解 相 关 模 块<br />

目 的 : 是 预 测 参 数 通 道 数 据 d(z).<br />

2. 瞬 态 信 号 检 测<br />

1. 计 算 传 输 函 数<br />

q(m)<br />

fcenter(k)<br />

3. 计 算 相 关 信 号


q(m)<br />

fcenter(k)<br />

1. 计 算 传 输 函 数


2. 瞬 态 信 号 检 测


立 体 声 处 理 模 块<br />

目 的 : 实 现 计 算 相 位 和 振 幅 参 数 , 调 整 目 标 通 道 幅 值 和 相 位 , 还 原 立 体 生 数 据 .<br />

由 立 体 声 参 数 推 导 参 数 矩 阵 的 过 程 如 下<br />

iid,iic,ipd,<br />

opd 参 数<br />

h(z) H(z,ne) H(z,n)


icc_mode=0,1,2 时 振 幅 参 数 的 计 算 icc_mode=3,4,5 时 振 幅 参 数 的 计 算


相 位 参 数 计 算 于 立 体 声 参 数 矩 阵 计 算<br />

当 IPD.OPD 有 效 时<br />

exp( j1<br />

( b( k))) 1<br />

exp( j2( b( k))) 1<br />

exp( j3( b( k))) 1<br />

exp( j<br />

( b( k))) 1<br />

4<br />

当 IPD.OPD 无 效 时<br />

exp( j1<br />

( b( k)))<br />

exp( j2( b( k)))<br />

exp( j3( b( k)))<br />

exp( j<br />

( b( k)))<br />

4


参 数 内 插<br />

立 体 声 重 建


重 建 后 的 左 右 频 带 数 据 别 再 经 过 PS 内 部 的 混<br />

合 滤 波 器 组 和 SBR 的 QMF 滤 波 器 器 组 还 原 时<br />

域 信 号 .


AAC_LC<br />

MP3


背 景 :<br />

AC3 的 前 身 还 包 括 AC1 和 AC2, 只 不 过 因 为 效 果 不 是 很 好 没 有 得<br />

到 广 泛 应 用 .1994 年 12 月 27 日 , 日 本 先 锋 公 司 宣 布 与 美 国 的 杜 比 实 验<br />

室 合 作 在 之 前 AC2 的 基 础 上 研 制 成 功 新 的 环 绕 声 制 式 , 并 命 名 为<br />

“ 杜 比 AC-3(Dolby Surround Audio Coding-3)”。1997 年 初 ,<br />

杜 比 实 验 室 已 正 式 将 杜 比 AC-3 环 绕 声 改 称 为 杜 比 数 码 环 绕 声<br />

(Dolby Surround Digital), 简 称 为 Dolby Digital.. 现 被 广 泛 应 用 于<br />

DVD 影 碟 , ATSC 数 字 地 面 电 视 , DLNA 家 庭 互 联 , 有 线 电 视 , 卫 星 电 视 .<br />

技 术 特 点 :<br />

采 样 率 : 32、44.1、48 kHz<br />

码 率 : 96Kbps-640Kbps<br />

声 道 数 : 6 声 道<br />

AC3 编 码 器


AC3 技 术 特 点<br />

MS + Coupling<br />

MDCT<br />

SQ<br />

Bit allocation<br />

DRC<br />

Encoded AC3<br />

Bitstream<br />

AC-3 frame synchronization, error detection, and frame de-formatting<br />

Encoded<br />

Spectral<br />

envelop<br />

Bit allocation<br />

Bit allocation<br />

infomation<br />

Mantissa<br />

De-quantization<br />

Quantized<br />

mantissas<br />

mantissa<br />

Spectral<br />

Envelop<br />

decoding<br />

Exponent<br />

Synthesis Filter<br />

Bank<br />

PCM time<br />

samples


Bit Allocation<br />

AC3 的 Bit Allocation 技 术 和 MPEG1/2 层 1/2 的 位 分 配 技 术 相 似 . 但 与<br />

之 不 同 的 是 AC3 算 法 通 过 传 输 编 码 参 数 , 在 解 码 端 进 行 心 理 声 学 模 型 的 逆 运<br />

算 计 算 每 个 采 样 需 要 的 分 配 位 数 . 比 特 指 派 对 音 频 信 号 从 掩 蔽 效 应 分 析 它 的<br />

频 谱 包 络 , 以 确 定 分 配 给 各 频 谱 系 数 的 尾 数 所 需 要 的 比 特 数 。<br />

指 数<br />

功 率<br />

谱 密<br />

度<br />

带 化 的<br />

功 率 谱<br />

密 度<br />

谱 包 络 变 换 频 带 划 分 扩 展 函 数 听 阈<br />

激<br />

励<br />

函<br />

数<br />

掩 蔽 曲 线<br />

掩 蔽 比 较<br />

比 特 分 配


Mantissa Decode<br />

AC3 中 mantissa 的 意 义 和 其 他 编 码 标 准 的 残 差 谱 线 意 义 是 一 样 的 . 尾 数 的 量 化 和 解 码<br />

根 据 比 特 指 派 计 算 出 的 BAP 值 将 所 有 尾 数 量 化 到 同 一 等 级 精 度 上 。 该 步 骤 先 从 码 流 中<br />

取 出 尾 数 信 息 , 再 将 尾 数 信 息 和 指 数 解 码 解 出 的 频 谱 指 数 信 息 组 合 成 频 谱 系 数 , 在 解<br />

码 时 , 将 BAP 值 作 为 索 引 在 量 化 表 格 中 查 出 尾 数 占 用 的 比 特 数 , 根 据 该 比 特 数 将 尾 数<br />

从 码 流 中 取 出 , 在 根 据 BAP 值 对 尾 数 进 行 反 量 化 . 最 后 乘 以 指 数 值 .AC3 对 尾 数 的 组 装<br />

也 是 有 分 组 解 码 的 , 一 切 都 根 据 bap 值 的 提 示 进 行 . 而 且 根 据 bap 值 的 不 同 , 量 化 器 的 选<br />

择 也 不 同 ,AC3 即 使 用 了 均 匀 量 化 器 也 是 用 了 非 均 匀 量 化 器 .


Exponent Decode<br />

AC3 的 Exponent 参 数 的 意 义 和<br />

其 他 编 码 标 准 的 scalefactor 是 一 样 的 ,<br />

都 是 起 到 按 照 bark 谱 量 化 的 目 的 . 对<br />

exponent 的 编 码 AC3 采 用 差 分 分 组<br />

的 方 式 编 码 . 而 每 个 码 字 表 示 二 进 制 表<br />

达 式 中 前 导 零 的 个 数 ,AC3 标 准 采 用<br />

了 一 些 共 享 策 略 . 指 数 信 息 在 一 个 数 据<br />

帧 内 的 各 个 音 频 块 之 间 可 以 共 享 , 即<br />

根 据 不 同 指 数 共 享 策 略 数 据 块 1 到 数 据<br />

块 5 可 以 重 复 使 用 以 前 数 据 块 的 指 数 信<br />

息 。<br />

开 始<br />

是 否 重 用 上<br />

一 块 指 数<br />

N<br />

获 得 指 数 策 略 和 指<br />

数 组 编 码 值<br />

指 数 解 码 策 略<br />

Y<br />

结 束<br />

分 解 指 数 包 , 得 到<br />

编 码 值 序 列<br />

求 指 数 差 分 值 序 列<br />

差 分 解 码 , 得 到 实<br />

际 指 数


• Stereo Process<br />

AC3 使 用 了 2 种 技 术 对 通 道 对 进 行 处 理 . 一 种 是<br />

耦 合 技 术 一 种 是 rematrixing 技 术 . 其 中 rematrixing 技<br />

术 和 其 他 标 准 中 的 ms 技 术 是 完 全 一 样 的 .coupling 技<br />

术 在 其 后 的 AAC 标 准 种 也 有 使 用 .<br />

‣ Coupling<br />

耦 合 是 对 IS 编 码 的 推 广 .<br />

Demux<br />

解 码 耦 合 系 数<br />

left left ' right<br />

'<br />

right left ' right<br />

'<br />

解 码 参 考<br />

声 道 数 据<br />

耦 合 声 道 重 建<br />

‣ Rematrixing<br />

Rematrixing 和 Coupling 有 冲 突 .<br />

应 用 频 带 范 围 有 限 制 .


注 意 AC3 和 AAC 的 在 耦 合 上 的 差 别<br />

1.AAC 可 以 在 时 域 和 频 域 2 个 方 向 上 应 用 耦 和 .ac3 只 在 频 域 上 使 用 耦<br />

合 .<br />

2.AC3 没 有 sfb 的 概 念 , 所 以 有 独 立 的 coupling sub-band 和 band。<br />

每 个<br />

耦 合 band 有 一 个 耦 合 系 数 。sub-band 是 频 带 系 数 。n 个 subband 可<br />

以 组 成 一 个 band。 码 流 中 有 一 个 标 志 位 指 示 分 组 方 式 。 这 个 标 志 位 的<br />

解 码 和 AAC 中 窗 分 组 的 方 式 是 一 样 。AAC 有 sfb 的 概 念 , 每 个 sfb 一 个<br />

耦 合 因 子 。<br />

3.AAC 的 解 耦 合 公 式 是 dst+=src*cscale<br />

AC3 的 解 耦 合 公 式 是 dst =src*cscale<br />

4.AAC 是 全 频 带 , 一 直 到 max_sfb<br />

AC3 是 部 分 频 带 , 系 数 地 址 是 37~252


MDCT<br />

AC3 的 时 频 变 换 模 块 和 AAC 的 类 似 , 解 码 时 也 是 要 经 过 3 步 处<br />

理 ,IMDCT, 加 窗 和 交 叠 加 . 只 不 过 AC3 的 MDCT 窗 长 度 分 别 是 256 和<br />

512. 而 且 窗 类 型 稍 有 差 别 .


2005 年 为 了 迎 接 即 将 到 来 的 HD/ 蓝 光 高 清 时 代 , 杜 比 公 司 推 出 了 全<br />

新 的 DOLBY DIGITAL PLUS 音 效 格 式 。 该 格 式 最 高 能 够 支 持 多 达<br />

13.1 声 道 的 环 绕 声 音 效 , 而 最 低 能 够 支 持 7.1 声 道 。 高 码 率 的 DD<br />

PLUS 音 效 将 用 于 以 HD/ 蓝 光 光 盘 为 介 质 的 电 影 中 使 用 , 而 码 律 较 低<br />

的 DD PLUS 音 效 将 用 于 电 视 台 的 电 视 信 号 传 输 .<br />

码 率 32Kbps-6Mbps<br />

声 道 数 最 高 13.1 声 道 , 最 低 7.1 声 道 .<br />

采 样 率 16khz,22.05khz,24khz,32khz,44.1khz,48khz<br />

NBC


• EAC3 技 术 特 点<br />

关 键 模 块 有<br />

AHT 模 块<br />

ECC 模 块<br />

SE 模 块<br />

TNP 模 块<br />

Exponent decode<br />

bit allocation<br />

HE-bit allocation<br />

VQ decoder<br />

GAQ decoder<br />

Mantissa decode<br />

IDCT<br />

AHT 模 块<br />

Enhanced channel<br />

coupling<br />

(ECC)<br />

Spectral Extension<br />

(SE)<br />

IMDCT<br />

瞬 态 噪 声 处 理<br />

(TNP)<br />

技 术 框 图


AHT<br />

EAC3 的 Adaptive Hybrid Transform (AHT) 模 块 只 有 当 码 流 中 的 标 识 位<br />

有 效 时 , 该 模 块 才 有 效 。 该 模 块 包 含 3 个 子 单 元 , 参 数 位 分 配 , 改 进 的 量 化<br />

单 元 和 DCT 单 元 。 当 标 识 位 指 示 使 用 AHT 模 块 时 , 比 特 流 先 进 入 参 数 比 特 分 配<br />

单 元 , 提 取 位 分 配 信 息 . 使 用 GAQ 或 是 VQ 的 方 法 反 量 化 重 构 残 差 谱 线 , 再 结 合<br />

exponent 参 数 重 构 频 域 谱 线 , 最 后 经 过 IDCT 变 换 , 产 生 低 分 辨 率 频 域 谱 线 .


参 数 位 分 配 与 量 化<br />

AHT 模 块 中 的 位 分 配 技 术 与 AC3<br />

中 的 位 分 配 技 术 类 似 但 并 不 相 同 ,<br />

只 是 对 bap 的 表 做 了 改 进 . 当 使 用<br />

AHT 模 块 时 使 用 hebap 表 .<br />

反 量 化 前 , 先 要 根 据 每 个 bap 值<br />

选 择 反 量 化 模 块 ( 如 图 ).<br />

EAC3 使 用 了 VQ 和 GAQ 的 方 法<br />

对 频 域 谱 线 进 行 量 化 . 当 使 用 VQ 进<br />

行 量 化 时 6 个 交 叉 块 的 mantissa 数<br />

据 组 成 一 个 矢 量 , 统 一 分 配 量 化 . 解<br />

码 时 从 码 流 中 获 得 vq 索 引 后 查 表<br />

可 得 6 个 频 域 谱 线 .


GAQ 原 理 :<br />

每 个 DCT 块 中 , 频 率 高 出 现 的 数 字 使 用 增 益 放 大 并 用 短 码 字 传 输 。<br />

频 率 出 现 低 的 系 数 不 使 用 增 益 放 大 , 但 用 长 码 字 传 输 。 每 个 DCT 块<br />

一 个 Gain 系 数 , 编 码 器 可 以 一 帧 一 帧 的 调 整 频 率 统 计 表 , 所 以 要 用<br />

一 个 模 式 选 择 标 识 用 定 长 码 在 码 流 中 传 输 。


Enhance Channel Coupling 模 块<br />

EAC3 改 进 了 耦 合 处 理 模 块 提 高 立 体 声 编 码 的 效 率 . 当 使 用 该 单 元 解 码 时 , 首 先 对 输 入 的<br />

源 频 域 数 据 进 行 处 理 , 计 算 耦 合 通 道 的 频 谱 数 据 , 再 计 算 振 幅 参 数 和 角 度 参 数 . 最 后 把 2<br />

个 参 数 应 用 到 生 成 的 频 谱 数 据 中 即 可 得 耦 合 通 道 的 完 整 频 谱 系 数 .ECC 模 块 也 要 对 频<br />

域 系 数 进 行 分 组 , 从 13 到 252 每 6 或 12 个 数 据 为 一 个 子 带 , 共 22 个 子 带 .<br />

码 流 信 息 与 源 通 道 数 据<br />

振 幅 参 数 处 理<br />

混 沌 参 数 处 理<br />

角 度 参 数 处 理<br />

源 声 道<br />

残 差 谱 线 处 理<br />

耦 合 声 道 生 成<br />

耦 合 通 道 残 差<br />

谱 线


源 通 道 残 差 数 据 处 理 单 元 由 4 步 组 成 :<br />

step1: 对 前 一 个 块 , 当 前 块 和 下 一 个 块 的 增<br />

强 耦 合 系 数 分 别 进 行 IMDCT 变 换 和<br />

dewindow。 如 前 一 个 块 没 有 使 用 增 强<br />

耦 合 , 则 前 一 个 块 的 系 数 为 0.<br />

step2: 执 行 交 叠 加 处 理 。 对 前 一 个 块 的 后 半<br />

块 数 据 和 下 一 个 块 的 前 半 块 数 据 和 到 一<br />

起 和 当 前 块 的 数 据 相 加 。<br />

step3: 后 处 理 , 余 弦 调 整 。 产 生 复 数 域 数 据 。<br />

step4: 在 复 数 域 上 执 行 DFT 变 换 。<br />

前 一 块<br />

+<br />

当 前 块<br />

后 一 块<br />

Step2:WOA<br />

step3<br />

Step4:DFT


参 数 计 算<br />

这 部 分 包 括 三 个 参 数 的 计 算 , 振<br />

幅 参 数 , 角 度 参 数 和 chaos 参 数 .<br />

码 流 解 析<br />

查 表 获 得<br />

振 幅 参 数<br />

查 表 解 码<br />

Chaos 参 数<br />

查 表 解 码<br />

角 度 参 数<br />

振 幅 参 数<br />

调 整<br />

内 插 调 整<br />

振 幅 参 数<br />

amp[ch][bin]<br />

随 机 数 产 生<br />

角 度 参 数<br />

调 整<br />

角 度 参 数<br />

rangle[ch][bin]


耦 合 声 道 变 换 系 数 产 生<br />

1. 重 构 频 域 数 据<br />

2. 系 数 转 换


Spectral Extension<br />

Processing<br />

EAC3 的 谱 扩 展 技 术 是 一 种<br />

类 似 HE-AAC 中 SBR 的 一 种<br />

技 术 . 作 用 都 是 通 过 从 低 频<br />

带 复 制 高 频 带 数 据 , 再 对 复<br />

制 频 带 进 行 调 中 以 在 码 流 中<br />

不 传 输 高 频 带 数 据 , 提 高 编<br />

码 效 率 .<br />

SE 模 块 把 谱 线 数 据 从 第 25 个<br />

数 据 到 第 228 个 数 据 分 成 17<br />

个 子 带 , 每 个 子 带 12 个 系 数 .<br />

对 使 用 耦 合 处 理 的 频 带 采 用<br />

坐 标 从 37 到 228 的 谱 线 范 围 .<br />

分 成 16 个 子 带 , 每 个 子 带 12<br />

个 数 据 .<br />

Transform Coefficient<br />

Translation<br />

Transform Coefficient<br />

Band Border Filtering<br />

参 数 与 低 频 数 据<br />

Banded RMS Energy<br />

Calculation<br />

Noise Scaling and<br />

Transform Coefficient<br />

Blending Calculation<br />

Blended Transform<br />

Coefficient Scaling<br />

频 带 数 据<br />

Blending Factor<br />

Calculation<br />

Spectral Extension<br />

Coordinate Format<br />

SE 技 术 分 为 谱 线 复 制 , 谱 线 调<br />

整 两 模 块 .


谱 线 复 制<br />

SE 的 谱 线 复 制 是 从 码 流 中 解 析 出 每 个 子<br />

带 的 源 复 制 开 始 位 置 , 源 复 制 结 束 位 置<br />

和 目 标 插 入 开 始 位 置 3 个 参 数 . 每 个 块<br />

内 的 所 有 子 带 这 三 个 参 数 相 同 . 然 后 按<br />

照 顺 序 把 谱 线 从 源 地 址 复 制 插 入 目 的<br />

地 址 区 .<br />

谱 线 调 整<br />

谱 线 调 整 包 括 边 界 滤 波 , 噪 声 混 合 和 振 幅<br />

调 整 .<br />

边 界 滤 波 是 针 对 复 制 边 界 或 wrap 产 生<br />

的 区 域 进 行 滤 波 . 使 用 5 阶 滤 波 器 中 间<br />

对 称 , 查 表 获 得 滤 波 器 系 数 .<br />

噪 声 混 合 在 子 带 RMS 能 量 计 算 , 噪 声 产<br />

生 和 噪 声 因 子 解 码 完 成 以 后 执 行 .<br />

振 幅 调 整 在 噪 声 调 整 之 后 计 算 出 的 频 谱<br />

系 数 乘 以 一 个 scale.<br />

fc fc* fscale nc*<br />

nscale


Pre-noise process<br />

PNP 是 一 种 减 少 pre-noise 持<br />

续 时 间 的 新 技 术 . 应 用 在 时 频<br />

变 换 之 后 , 真 的 时 域 数 据 进 行<br />

处 理 .<br />

TC1 = 256<br />

TC2 = 128


Pre-noise process


背 景 :<br />

DTS 是 “Digital Theatre System” 的 缩 写 , 是 “ 数 字 化 影 院 系 统 ” 的 意 思 ,<br />

DTS 总 公 司 位 于 美 国 加 州 的 洛 杉 矾 。DTS 采 用 CAC(Coherent Acoustics<br />

Coding, 相 干 声 学 编 码 ) 方 式 工 作 , 和 Dolby Digital 一 样 也 属 于 利 用 心 理<br />

声 学 原 理 来 对 声 轨 进 行 编 码 的 有 损 的 数 字 压 缩 技 术 。<br />

技 术 指 标 :<br />

采 样 率 :8,16,32,11.025,22.05,44.1,12,24,48khz,96khz,192khz,<br />

比 特 率 :32~3840kbps<br />

通 道 数 :6 通 道


DTS 技 术 特 点<br />

MS+IS<br />

QMF<br />

SQ/VQ<br />

Prediction<br />

Huffman Coding/Block<br />

Coding<br />

DTS 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Huffman 解 码<br />

反 量 化<br />

ADPCM<br />

Intensity<br />

<br />

DTS-HD<br />

unknown<br />

MS 解 码<br />

Filterbank<br />

输 出 PCM 数 据


比 特 解 码 与 谱 线 重 建<br />

DTS 的 谱 线 解 码 可 以 使 用 huffman 编 码 算 法 或 是 Block 编 码 算 法 . 如 果 码 流 使<br />

用 块 编 码 , 解 码 时 从 码 流 得 到 当 前 帧 使 用 那 种 块 解 码 模 式 . 按 照 模 式 解 码 . 解 码<br />

方 法 有 2 种 . 一 次 解 码 出 4 个 量 化 谱 线 数 据 .<br />

例 :<br />

方 法 1: 商 解 法<br />

方 法 2: 差 解 法


Q 模 块<br />

DTS 的 量 化 模 块 有 2 中 编 码 方 法 , 对 低 频 数 据 和 scale factor 使 用 标 量 量 化 方 法 , 对 高 频 数 据 可 以<br />

选 择 使 用 矢 量 量 化 .<br />

当 使 用 标 量 量 化 时 :<br />

首 先 要 从 码 流 中 解 析 scale factor, 经 过 差 分 huffman 或 是 差 分 线 性 解 码 的 scale factor 再 经<br />

过 逆 开 方 量 化 表 查 表 出 得 数 据 . 其 次 解 码 出 quant_step 数 据 . quant_step 使 用 huffman 解 码 或 是<br />

线 性 解 码 解 出 . 再 解 码 出 scale 调 整 参 数 re_adj[ch]. 最 后 由 下 面 公 式 重 构 量 化 谱 线 .<br />

其 中 每 通 道 每 子 带 的 scale_factor 每 帧 更 新 一 次 . 而 quant_step 每 个 子 帧 更 新 一 次 .<br />

当 使 用 矢 量 量 化 时 :<br />

从 码 流 中 解 析 出 矢 量 索 引 , 查 表 后 乘 以 scale_factor 可 得 反 量 化 数 据 .<br />

标 量 反 量 化 公 式<br />

iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* quat _ step[ ch][ sub]* scale _ factor[ ch][ sub]* re _ adj[ ch]<br />

矢 量 反 量 化 公 式<br />

iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* scale _ factor[ ch][ sub]


ADPCM<br />

如 果 码 流 中 信 息 位 PMODE 为 1 表 示 DTS 使 用 了 4<br />

阶 前 向 预 测 器 . 从 码 流 中 解 析 出 4 个 预 测 系 数 , 按 照<br />

下 列 公 式 计 算 .<br />

3<br />

sample coeff<br />

[ n]* iquant _ sample[ ch][ sub][ n]<br />

n0


Stereo Process<br />

DTS 的 立 体 声 处 理 上 也 使 用 了<br />

MS 技 术 和 IS 技 术 .<br />

方 法 类 MP3.<br />

• QMF<br />

DTS 使 用 类 似 MPEG1/2 filterbank 的 QMF 滤 波 器 处 理 时 频 数 据 . 解<br />

码 时 , 通 过 QMF 综 合 滤 波 器 组 后 要 加 窗 和 累 加 . 而 与 MPEG1/2 不 同 的<br />

是 ,DTS 使 用 32 个 子 带 , 每 个 子 带 32 个 数 据 . 转 换 函 数 也 不 同 . 窗 函 数 也<br />

不 同 ,DTS 提 供 2 种 窗 函 数 .<br />

k<br />

k<br />

a<br />

cos( k<br />

)*sin( )*sin( )<br />

2 4<br />

(2i33)(2k1)<br />

<br />

M[ i][ k] 0.5* a*cos( )<br />

128


DTS-HD 是 一 套 相 关 声 学 音 频 编 码 系 统 , 包 含 原 先 的 DTS 数 字 环 绕 声 ,<br />

DTS-ES 和 DTS 96/24, 也 加 有 无 损 压 缩 技 术 。 但 它 具 有 更 高 的 互 换 性<br />

和 扩 张 性 , 除 了 兼 顾 更 高 音 质 、 更 多 声 道 外 , 还 能 兼 容 网 络 下 载 内<br />

容 的 互 动 性 。 取 样 频 率 和 声 道 选 取 也 更 加 灵 活 。 但 依 然 保 持 了 压 缩<br />

比 例 比 DD+ 小 的 特 点 , 故 声 音 信 息 损 失 少 、 细 节 更 为 丰 富 。<br />

<br />

<br />

<br />

采 样 率 8-192kHz(16/24bit)。<br />

声 道 数 :7.1~32 声 道<br />

码 率 : 可 以 达 到 1.5MBPS 以 上


背 景 :<br />

AVS 音 频 标 准 是 AVS 标 准 族 的 一 个 部 分 , 文 档 编 号 是 AVS-P3.AVS 音 频 标<br />

准 出 来 采 用 了 三 星 的 CBC 熵 编 码 技 术 和 芯 晟 的 PQ-SPSC 立 体 声 处 理 技 术 外 ,<br />

其 余 技 术 全 部 使 用 了 EVD 音 频 标 准 的 内 容 , 包 括 FLPVQ,2 级 MDCT 分 析 等 .<br />

技 术 指 标 :<br />

采 样 率 :8kHz-96kHz<br />

码 率 :16kbps-96kbps/ 声<br />

道<br />

声 道 : 支 持 32 个 主 声 道 、8<br />

个 低 频 增 强 声 道


• AVSA 技 术 特 点<br />

PQ-SPSC<br />

MDCT(2 级 )<br />

SQ<br />

上 下 文 位 平 面<br />

解 码<br />

后 量 化 方 极 坐 标<br />

立 体 声 解 码<br />

Bit Slice huffman Coding<br />

FLPVQ<br />

AVS Audio 编 码 音 频 流<br />

比 特 流<br />

去 格 式<br />

化 器<br />

反 量 化<br />

多 分 辨 率 综 合<br />

逆 频 域 线 性 预 测<br />

及 矢 量 量 化<br />

反 向 MDCT 变 换<br />

输 出 时 间 信 号


CBC<br />

三 星 提 出 的 CBC 熵 编 码 算 法 实 际 熵 是 采 用 了 他 们 自 己 在 BSAC 种 的 熵 编<br />

码 技 术 , 但 是 使 用 huffman 编 码 方 法 替 代 了 算 术 编 码 方 法 . 其 余 编 码 原 理 和<br />

BSAC 技 术 几 乎 完 全 一 致 .<br />

上 下 文 位 平 面 无 损 解 码 是 根 据 输 出 速 率 或 接 收 到 的 比 特 流 的 截 断 情 况 ,<br />

使 用 全 部 的 子 解 码 器 或 部 分 的 子 解 码 器 , 如 图 所 示 。 在 各 子 解 码 器 中 , 各 比 特<br />

层 矢 量 从 最 高 比 特 位 到 最 低 比 特 位 , 从 低 频 带 到 高 频 带 逐 级 解 码 。


CBC 解 码 与 谱 线 分 析<br />

利 用 上 下 文 信 息 的 比 特 层 熵 编 码 。<br />

‣ 编 码 带 : 上 下 文 位 平 面 编 码 的 一 个 基 本 编 码 单 元 , 每 个 编 码 带 包 含 32 个 频 谱 系 数 。<br />

‣ 编 码 子 层 : 每 个 子 层 包 含 一 个 或 多 个 上 下 文 位 平 面 编 码 的 编 码 带 。<br />

‣ 基 本 层 : 是 上 下 文 位 平 面 编 码 中 信 号 最 低 质 量 的 编 码 层 , 每 帧 包 含 一 个 基 本 层 , 一 个 基<br />

本 层 包 含 若 干 个 子 层 。<br />

‣ 增 强 层 : 是 上 下 文 位 平 面 编 码 中 用 来 增 强 基 本 层 质 量 的 编 码 层 , 每 帧 根 据 目 标 编 码 速 率<br />

包 含 若 干 个 子 层 。<br />

‣ 编 码 位 平 面 矢 量 : 每 个 位 平 面 编 码 矢 量 包 含 4 个 比 特 , 来 自 于 相 邻 的 4 个 频 谱 系 数 , 进 行 哈<br />

夫 曼 编 码 。


Stereo Process<br />

PQ-SPSC(Post-quatization Square Polar Stereo Coding)<br />

利 用 量 化 频 谱 中 声 道 对 间 的 相 关 性 在 给 定 音 质 下 降 低 码 率 , 或 在 给 定 的 码 率 下 提 高 音 质 。 通<br />

常 声 道 对 的 布 局 是 左 声 道 / 右 声 道 , 或 者 左 环 绕 / 右 环 绕 。PQ-SPSC 的 应 用 是 以 比 例 因 子 带 为 最 小<br />

单 位 的 。 也 就 是 说 对 某 一 比 例 因 子 带 中 的 所 有 量 化 后 MDCT 频 谱 或 者 全 部 使 用 PQ-SPSC, 或 者 全<br />

部 不 使 用 PQ-SPSC。 这 样 做 是 为 了 减 少 边 信 息 。<br />

公 式 如 下 :


T 模 块<br />

AVSA 的 时 频 转 换 模 块 由 2 级 MDCT 构 成 . 每 级 MDCT 有 变 换 和 WOA 两 个 子 模 块 组 成 .<br />

在 进 行 16 点 IMDCT 之 前 还 要 进 行 谱 线 重 排 .AVS 没 有 长 短 窗 分 析 , 编 码 时 先 进 行 2048<br />

点 的 MDCT 变 换 , 对 瞬 态 信 号 再 进 行 一 次 128 个 MDCT 变 换 (16 个 输 入 ,8 个 输 出 )。<br />

解 码 时 , 是 一 个 反 过 程 , 对 瞬 态 信 号 要 先 进 行 128 个 IMDCT 变 换 (8 个 输 入 ,16 个 输<br />

出 )。 再 进 行 2048 点 的 IMDCT. 对 稳 态 信 号 只 进 行 一 次 2048 点 的 IMDCT 信 号 即 可 . 每<br />

级 IMDCT 之 后 都 还 有 加 窗 和 交 叠 加 处 理 .<br />

处 理 过 程<br />

瞬 态 信 号<br />

标 志 和 谱<br />

线 输 入<br />

稳 态 信 号<br />

标 志 和 谱<br />

线 输 入<br />

谱 线<br />

重 排<br />

16 点<br />

IMDCT<br />

加 窗<br />

交 叠<br />

加<br />

2048 点<br />

IMDCT<br />

加 窗<br />

交 叠<br />

加<br />

时 域 PCM<br />

信 号<br />

IMDCT 公 式<br />

N<br />

1<br />

2<br />

2 2<br />

1 <br />

xin<br />

,<br />

spec[ i][ k]*cos n n0 k , 0 n N, n0<br />

N<br />

/ 2 1<br />

2<br />

N<br />

<br />

k0<br />

N<br />

2


FLPVQ<br />

在 编 码 端 , 对 滤 波 器 组 的<br />

输 出 系 数 , 按 照 一 定 的 增 益 阈<br />

值 进 行 线 性 预 测 , 如 果 增 益 阈<br />

值 满 足 给 定 的 条 件 , 则 用 线 性<br />

预 测 滤 波 器 对 频 域 系 数 预 测 分<br />

析 , 预 测 滤 波 器 的 参 数 采 用 分<br />

级 分 裂 矢 量 量 化 。 在 解 码 端 ,<br />

从 码 流 中 解 码 得 到 的 是 预 测 器<br />

系 数 量 化 后 的 码 书 索 引 。 起 始<br />

预 测 频 率 为 1875Hz 到 max_sfb。<br />

线 性 预 测 合 成 滤 波 器 的 传 递 函<br />

数 定 义 为 :<br />

1<br />

Aˆ(<br />

z)<br />

<br />

1<br />

<br />

i1<br />

解 码 LSP 参 数 LSP to LPC 频 域 滤 波<br />

P<br />

1<br />

a ˆ z i<br />

i


f<br />

f<br />

<br />

1<br />

1<br />

2<br />

1<br />

( z)<br />

(1 z ) (1 2q i<br />

z z )<br />

i1,3,..,<br />

P1<br />

<br />

1<br />

1<br />

2<br />

2<br />

( z)<br />

(1 z ) (1 2q i<br />

z z )<br />

i2,4,..,<br />

P<br />

1 st lsf1 lsf2 lsf3 lsf4 lsf5 lsf6<br />

2 nd lsf7 lsf8 lsf9 lsf10 lsf11 lsf12<br />

3 nd dlsf1 dlsf2 dlsf3 dlsf4 dlsf5 dlsf6<br />

4 th dlsf7 dlsf8 dlsf9 dlsf1<br />

0<br />

dlsf1<br />

1<br />

dlsf1<br />

2<br />

for (i = 1; i = 1; j--)<br />

curr_f[j] = prev_f[j] - 2*lsp[2*i-1-1] * prev_f[j-1] + prev_f[j-<br />

2];<br />

for(kk=0;kk


背 景 :<br />

DRA 是 由 广 晟 数 码 开 发 的 多 声 道 音 频 编 码 标 准 . 被 收 录 成 为 国 家 标 准 .<br />

技 术 指 标 :<br />

采 样 率<br />

码 率<br />

通 道 数<br />

:8~192khz<br />

:32~2304kbps<br />

:64+3 个 通 道


DRA 技 术 特 点<br />

Huffman 解 码<br />

IS + MS<br />

MDCT<br />

反 量 化<br />

SQ<br />

Huffman Coding<br />

DRA 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Rescaling<br />

M/S 解 码<br />

Intensity 解 码<br />

交 叉 重 组<br />

IMDCT<br />

输 出 PCM 数 据


时 频 转 换 模 块<br />

DRA 的 时 频 变 换 模 块 是 使 用 了 和 AAC 一 样 的 MDCT 变 换 进 行 时 频<br />

分 析 . 窗 长 是 128 或 1024 个 数 据 . 解 码 时 经 过 变 换 后 也 要 通 过 加 窗 和 交<br />

叠 加 (WOA). 使 用 正 弦 窗 , 比 较 有 特 点 是 使 用 了 13 种 窗 形 状 .<br />

变 换 公 式


WOA<br />

DRA 的 基 本 窗 是 正 弦 窗 . 但 是 灵 活 的 扩 展 了<br />

13 种 窗 形 , 以 便 于 更 好 的 描 述 信 号 类 型 .DRA<br />

的 交 叠 加 和 MP3,AAC 完 全 一 样 . 当 前 帧 的 前<br />

半 部 分 数 据 和 前 一 帧 的 后 半 部 分 相 加 .<br />

WIN_LONG_LONG2LONG<br />

WIN_LONG_LONG2SHORT<br />

WIN_LONG_LONG2BRIEF<br />

WIN_LONG_SHORT2SHORT<br />

WIN_LONG_BRIEF2BRIEF<br />

WIN_LONG_SHORT2BRIEF<br />

WIN_SHORT_SHORT2SHORT<br />

WIN_SHORT_BRIEF2BRIEF<br />

WIN_SHORT_SHORT2BRIEF


Stereo Process<br />

‣ 联 合 强 度 编 码<br />

结 合 起 始 IS 执 行 频 带 参 数 进 行 IS 解 码<br />

公 式 :<br />

联 合 声 道 样 本 = 比 例 因 子 * 源 声 道 样 本 .<br />

‣ 和 差 编 码<br />

灵 活 ,3 级 判 定<br />

位 置 获 取<br />

公 式 :<br />

左 声 道 = 和 声 道 + 差 声 道<br />

右 声 道 = 和 声 道 - 差 声 道


• 支 持 音 频 流 技 术<br />

• 压 缩 比 可 以 达 到 1∶18 左 右<br />

• 96Kbps 的 WMA 音 质 = 128Kbps 的<br />

MP3 音 质<br />

• 低 码 率 时 压 缩 比 和 音 质 优 于 MP3<br />

<br />

<br />

WMA7/8<br />

IS+ MS<br />

MDCT<br />

SQ/VQ<br />

Huffman Coding<br />

LSF<br />

WMA9 and WMA pro<br />

Unknown<br />

WMA7/8 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Huffman 解 码<br />

反 量 化<br />

MS 解 码<br />

IMDCT<br />

输 出 PCM 数 据


Cook 的 技 术 特 点<br />

Couple<br />

MLT<br />

SQ<br />

huffman coding<br />

noise fill<br />

Huffman 解 码 获 得<br />

vector_index<br />

Demuxer<br />

解 码 RMS 值<br />

噪 声 插 入<br />

反 量 化 和<br />

RMS 加 权<br />

IMLT<br />

内 插<br />

Cook decoder


Inverse Modulated Lapped Transform (IMLT)<br />

IMDCT 操 作 320 频 域 系 数 产 生 320 个 时 域 音 频 数 据 .IMLT 能 分 解 成 类 型 4 的 DCT<br />

变 换 . 在 IMLT 之 后 也 有 加 窗 和 交 叠 加 .<br />

IMLT<br />

Type IV DCT<br />

窗 函 数


QDM2 是 应 用 在 quicktime4 内 的 编 码 器 , 可 以 应 用 与 适 应 quicktime 流 媒 体<br />

的 网 络 点 播 和 下 载 中 .<br />

技 术 特 点 :<br />

IS<br />

FFT,PQMF<br />

SQ,<br />

huffman coding<br />

Demux<br />

Spectral decode<br />

Method decode<br />

Tone decode<br />

Stereo Process<br />

IDFT<br />

Filterbank


Sub Packet 0<br />

Sub packet<br />

Sub Packet 1<br />

Sub Packet 2<br />

Subband 0 Subband 1 ... Subband n<br />

Sub Packet 3<br />

Subband<br />

frame<br />

Sub Packet 4<br />

通 道 0 通 道 1 ... 通 道 n<br />

Sub Packet 5<br />

通 道<br />

谱 线 0 谱 线 1 谱 线 2 谱 线 3 谱 线 4 谱 线 7<br />

Sub Packet 15


背 景 :<br />

Ogg Vorbis 是 近 年 来 由 Xiph.Org Foundation 开 发 的 通 用 感 觉 音 频 编 码 器 ,<br />

其 特 点 是 : 源 码 完 全 开 放 、 无 专 利 限 制 , 具 有 较 大 编 码 灵 活 性 。 在 高 质 量<br />

( 高 比 特 率 ) 级 别 (CD 或 DAT 立 体 声 ,16/24 比 特 量 化 ), 与 现 在 的<br />

MPEG-2 和 MPEG-4 等 音 频 算 法 相 当 ;Ogg Vorbis 编 码 器 在 没 有 重 新 采 样 到<br />

低 采 样 率 情 况 下 , 可 以 将 CD 高 质 量 立 体 声 信 号 压 缩 到 低 于 48kbps 比 特 率 。<br />

技 术 指 标 :<br />

比 特 率 :16 到 128kb/s/ch ;<br />

采 样 率 8kHz-192kHz;<br />

声 道 数 : 单 声 道 、 立 体 声 、4 声 道 、5.1, 最 高 可 支 持 255 独 立 声 道 。


Vorbis<br />

Coupling<br />

MDCT<br />

SQ+VQ<br />

LSP<br />

Huffman Coding<br />

Residue decode<br />

Demuxer<br />

Floor<br />

reconstruction<br />

Compute<br />

Spectral curve<br />

Channel<br />

Uncoupling<br />

IMDCT


频 谱 包 络 分 析<br />

这 是 Ogg Vorbis 编 码 算 法 的 核 心 部 分 , 可 以 使 用 两 种 分 析 方 法 :<br />

Vorbis 基 底 类 型 0, 以 线 谱 对 LSP( 也 被 称 为 线 谱 频 率 LSF) 参 数 来 表 示 编 码<br />

平 滑 的 频 谱 包 络 曲 线 ,LSP 表 示 可 以 与 LPC 表 示 相 互 转 换 。Vorbis 基 底 类 型 1<br />

使 用 分 段 直 线 表 示 来 编 码 频 谱 包 络 曲 线 , 并 基 于 线 性 频 率 轴 和 对 数 (dB)<br />

幅 度 轴 画 出 曲 线 。 在 编 解 码 中 , 两 者 在 语 义 上 是 可 以 互 换 的 , 但 基 底 类 型 1<br />

提 供 了 更 稳 定 的 帧 间 特 性 , 因 此 在 所 有 耦 合 立 体 声 和 高 比 特 率 模 式 下 是 较 好<br />

的 选 择 , 并 且 与 基 底 0 相 比 其 解 码 更 加 简 单 。 在 基 底 1 算 法 中 , 对 短 块 使 用 11<br />

个 点 线 性 (10 折 线 ) 逼 进 频 谱 函 数 包 络 , 而 长 块 使 用 33 个 点 线 性 逼 进 , 且 两<br />

种 情 况 的 算 法 完 全 相 同 .


Vorbis 基 底 类 型 1 是 以 线 性 分 段 逼 近 方<br />

式 实 现 频 谱 包 络 曲 线 的 表 示 。 以 n=128 的 基<br />

底 采 样 为 例 , 对 各 个 分 段 点 的 频 率 (X 坐 标 )<br />

和 幅 度 (Y 坐 标 ) 分 别 进 行 一 系 列 编 码 得 到 压<br />

缩 的 比 特 流 , 在 解 码 端 , 首 先 从 码 流 中 解 码<br />

出 X 坐 标 值 。 这 些 坐 标 值 在 编 码 时 是 以 交 织<br />

方 式 编 码 的 , 如 假 设 编 码 时 频 率 坐 标 ( 即 X 坐<br />

标 ) 序 列 为 :0,16,32,48,64,80,96,112,128( 与<br />

实 际 不 符 , 仅 用 作 举 例 说 明 ), 则 在 对 X 坐 标<br />

值 编 码 时 按 照 规 律 交 织 为 :0, 128, 64, 32, 96,<br />

16, 48, 80, 112。 头 两 个 序 列 为 起 始 坐 标 和<br />

终 止 坐 标 , 其 后 依 次 分 段 去 点 . 假 定 X 序 列 0,<br />

128, 64, 32, 96, 16, 48, 80, 112。 对 应 的 Y<br />

值 序 列 分 别 为 :110, 20, -5, -45, 0, 30, -10。<br />

根 据 X 序 列 , 解 码 时 首 先 解 码 起 始 坐 标 0 和 终<br />

止 坐 标 128 对 应 的 幅 度 值 , 即 110, 20. 然 后 两<br />

点 确 定 一 条 直 线 ; 之 后 解 码 的 Y 值 对 应 与 X 序<br />

列 坐 标 的 第 三 个 , 即 64, 通 过 这 个 X 值 可 以 预<br />

测 其 在 已 确 定 的 线 段 中 对 应 的 幅 度 值 。 这 个<br />

预 测 值 并 非 编 码 原 值 , 在 此 基 础 上 , 我 们 从<br />

码 流 中 继 续 解 码 一 个 Y 值 , 这 个 值 是 一 个 差<br />

值 , 如 一 5。 利 用 预 测 值 和 差 值 可 以 确 定 真<br />

实 的 对 应 于 X 序 列 64 的 幅 度 值 Y=60.<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

65<br />

-5<br />

16 32 48 64 80 96 112 128<br />

16 32 48 64 80 96 112 128


声 道 耦 合 技 术<br />

正 方 形 极 坐 标 耦 合<br />

声 道 交 织 耦 合


时 频 变 换 模 块<br />

Ogg Vorbis 采 用 的 MDCT 变 换 类 似 于 MPEG-2 AAC 中 变 换 , 包 括 2 种 块 长 和 4 种 窗 型 。 对 于 通 常 的<br />

稳 态 信 号 , 为 获 得 编 码 效 率 , 变 换 长 度 从 64 到 4096 广 泛 使 用 , 但 通 常 采 用 长 度 M=2048, 而 对 于 频<br />

谱 变 化 迅 速 的 突 发 信 号 , 为 了 减 小 量 化 失 真 扩 散 的 “ 预 回 声 ” 失 真 , 切 换 到 M=256 的 短 块 MDCT。<br />

对 于 长 、 短 块 相 邻 时 的 长 块 MDCT 变 换 ,w(k) 则 改 为 采 用 起 始 窗 和 终 止 窗 来 保 证 长 窗 与 短 窗 之 间<br />

的 平 稳 过 渡 。Vorbis 编 码 中 采 用 了 一 种 新 颖 的 基 本 窗 函 数 , 公 式 如 下 .<br />

w(<br />

k)<br />

<br />

2 (<br />

k <br />

sin(sin (<br />

M<br />

for k 0,1,..., M 1<br />

0.5)<br />

)*<br />

<br />

)<br />

2


需 求 分 析<br />

技 术 分 析<br />

对 信 源 编 码 EQTP 技 术 以 及 S(tereo) 处 理 技 术<br />

的 灵 活 应 用 .<br />

发 展 趋 势<br />

面 向 存 储 : 趋 于 无 损 , 多 通 道<br />

面 向 传 输 : 区 域 深 度 挖 掘 人 耳 特 性


各 种 高 清 芯 片 中 的 音 频 部 分<br />

芯 片 代 号 支 持 的 音 频 标 准 实 现 方 式 芯 片 厂 商<br />

STi7200 Add WMA9,WMA9 pro,(7100 未 写 ) 双 ST231 400 ST<br />

BCM740x<br />

MPEG1 AUDIO,AAC LC,AC3,<br />

EAC3,HE-AACv1,WMA,WMA pro<br />

未 知<br />

Broadcom<br />

CX24501<br />

MPEG1/2 AUIDO,MPEG2/4 AAC,<br />

AC3,EAC3,HE-AACv1,WMA,<br />

WMApro,<br />

ARM11<br />

Conexant<br />

STB225<br />

DSP based, supports MPEG-1 layer<br />

1&2, MP3 ,MPEG-4 AAC ,Dolby<br />

Digital AC-3, AAC-HE, WMA,<br />

MIPS32<br />

NXP<br />

SMP863x<br />

Audio DSP supports wide variety of<br />

audio codecs<br />

8630 的 应 用 中 提 到 MPEG1/2 AUDIO,<br />

AC3, MPEG2/4 AAC,WMA<br />

Sigma Design<br />

ZR39150<br />

MPEG AUDIO,<br />

Zoran<br />

AC3,WMA 等<br />

STi7100 All Popular audio codec ST231 ST


各 种 系 统 中 的 音 频 部 分<br />

DTV 系 统<br />

ATSC<br />

DVB<br />

ISDB<br />

DMB-TH<br />

IPTV 系 统<br />

ITU<br />

DVB over IP<br />

ISMA<br />

Stream Media 系 统<br />

Windows Media<br />

音 频 部 分<br />

AC3/EAC3<br />

MPEG1/2 AUDIO,MPEG4 AAC,AC3/EAC3,HE-AACv1v2,DTS<br />

MPEG1/2 AUDIO 其 他 不 详<br />

DRA<br />

音 频 部 分<br />

MPEG1/2 AUDIO.MPEG2/4 AAC,HE-AACv1/v2,AC3,EAC3,AVS-P3 audio,<br />

DTS<br />

备 选 WMA<br />

HE-AACv2,AC3,EAC3 , AMR-WB+,<br />

MPEG2/4 AAC,HE-AACv1/v2<br />

音 频 部 分<br />

Windows Media Audio Codec<br />

Real Media Real Audio Codec ( AAC or Cook )<br />

Quicktime Media<br />

Quicktime Audio Codec (AAC or QDM)


各 种 系 统 中 的 音 频 部 分<br />

其 他 系 统<br />

ABS-S<br />

DVB-S/DVB-S2<br />

MDTV 系 统<br />

DVB-H<br />

MediaFlo<br />

DAB/DAB+/DAB-IP<br />

T-DMB<br />

S-DMB<br />

CMMB<br />

DRA<br />

多 种<br />

音 频 部 分<br />

AC3/EAC3<br />

AAC<br />

HE-AACv2,AC3,EAC3, AMR-WB+<br />

BSAC<br />

BSAC<br />

DRA


音 频 编 码 是 信 源 压 缩 与 人 类 听 觉 感 知 相 关 知 识 应 用 的 交 集 。 在 利<br />

用 人 耳 建 模 的 基 础 上 充 分 挖 掘 人 耳 的 不 可 听 特 性 并 加 之 信 源 压 缩 的<br />

各 种 技 术 实 现 音 频 压 缩 编 码 的 目 的 。 概 括 起 来 所 有 的 音 频 编 码 系 统<br />

都 是 使 用 信 源 压 缩 的 熵 编 码 技 术 (E), 量 化 技 术 (Q), 变 换 技 术 (T) 和 预 测<br />

技 术 (P) 。 再 加 上 立 体 声 处 理 技 术 (S) 总 共 有 EQTPS 五 种 技 术 的 应 用 。<br />

以 下 针 对 上 面 介 绍 的 音 频 标 准 在 这 五 种 技 术 应 用 中 的 区 别 分 别 进 行<br />

分 析 。


熵 编 码 技 术 (E)<br />

音 频 压 缩 系 统 中 经 过 前 端 处 理 后 , 输 入 给 熵 编 码 模 块 的 数 据 主 要<br />

有 3 类 , 编 码 控 制 参 数 ,scalefactor 参 数 和 谱 线 残 差 信 号 . 在 应 用 熵 编 码<br />

技 术 对 这 三 类 信 号 进 行 编 码 时 . 常 用 的 编 码 方 法 是 huffman 编 码 技 术 ,<br />

其 次 是 算 术 编 码 和 其 他 编 码 技 术 .<br />

位 分 配 技 术 :MP1/2 L1/2,AC3,EAC3,DTS<br />

算 术 编 码 技 术 :BSAC<br />

huffman 编 码 技 术 : 其 他 所 有 标 准 和 DTS.<br />

在 对 谱 线 残 差 信 号 编 码 时 huffman 编 码 应 用 最 广 泛 . 而 且 一 般 在 应<br />

用 huffman 编 码 可 以 对 残 差 谱 线 数 据 进 行 分 组 , 分 组 的 方 式 各 不 相 同 .


量 化 技 术 (Q)<br />

量 化 可 以 分 为 标 量 量 化 技 术 和 矢 量 量 化 技 术 . 量 化 技 术 实<br />

际 上 是 一 种 超 越 函 数 映 射 技 术 , 在 各 种 音 频 标 准 都 有 应 用 .<br />

量 化 的 目 的 是 降 低 谱 线 动 态 范 围 . 实 现 方 法 多 以 查 表 法 实<br />

现 .<br />

标 量 量 化 技 术 :<br />

均 匀 量 化 :<br />

除 法 量 化 : 用 频 域 谱 线 的 量 化<br />

非 均 匀 量 化 :<br />

对 数 量 化 : 对 scalefactor 的<br />

量 化<br />

指 数 量 化 :<br />

正 弦 量 化 :TNS 系 数 的 量 化<br />

开 方 量 化 :DTS 中 scalefactor<br />

的 量 化<br />

矢 量 量 化 技 术 :<br />

矢 量 量 化 技 术 主 要 针 对 高 频 数 据 进 行<br />

量 化 .<br />

EAC3,DTS,WMA 中 对 高 频 数 据 进 行 矢 量<br />

量 化 .<br />

Vorbis 中 针 对 一 般 谱 线 数 据 应 用 矢 量<br />

量 化 .<br />

TwinVQ,AVSA 中 针 对 LSP 数 据 进 行 矢 量<br />

量 化 .


预 测 技 术 (P)<br />

预 测 技 术 的 应 用 : 广 泛 应 用 于 各 种 标 准 . 一 般 的 信 号 压 缩 都 会 使 用 差<br />

分 预 测 编 码 . 而 有 些 预 测 应 用 通 道 内 , 通 道 间 , 帧 内 , 帧 间 . 以 达 到 压 缩 数<br />

据 减 小 噪 声 的 目 的 .<br />

通 道 内 : 大 量<br />

通 道 间 :MPEG2 audio 中 的 预 测 技 术 使 用 通 道 间 预 测 减 小 多 通 道 数 据 .<br />

帧 间 : MPEG4 AAC LTP 技 术 ( 前 向 自 适 应 ) 和 MPEG2 AAC<br />

prediction 技 术 ( 后 向 自 适 应 ).<br />

帧 内 : MPEG2 AAC TNS 技 术 . 注 意 TNS 目 的 不 是 压 缩 数 据 而 是 是 降 低<br />

pre-echo 噪 声 .<br />

HE-AACv1 的 SBR 技 术 中 应 用 预 测 技 术 生 成 高 频 数 据 .<br />

TwinVQ 技 术 中 应 用 预 测 技 术 对 谱 线 进 LPC 分 析 .<br />

各 种 标 准 对 预 测 技 术 的 应 用 (doc).


变 换 技 术 (T)<br />

基 于 人 耳 的 带 通 特 性 , 人 们 开 始 使 用 FFT 和<br />

PQMF 进 行 带 通 分 析 , 后 来 逐 步 通 过 MDCT 进 行 取 代 . 主 要 问<br />

题 是 带 通 分 析 不 可 避 免 的 带 入 频 带 交 叠 误 差 . 这 也 是 频 带<br />

处 理 技 术 引 入 的 主 要 误 差 . 技 术 发 展 是 从 早 期 的 大 运 算 量<br />

的 FFT 和 PQMF 到 小 运 算 量 且 容 易 进 行 频 带 交 叠 误 差 处 理 的<br />

MDCT 技 术 .<br />

变 换 技 术 主 要 过 程<br />

加 窗 , 变 换 , 去 交 叠 处 理<br />

各 种 标 准 对 变 换 技 术 的 应 用 (doc).


面 向 存 储 和 以 太 网 :<br />

由 于 存 储 介 质 和 网 络 带 宽 的 发 展 , 单 位 容 量 的 成 本 越 来 越 低 , 如<br />

Blue-DVD 单 层 25GB。 所 以 面 向 存 储 的 音 频 向 着 无 损 和 多 通 道 的 方<br />

向 发 展 。WavPack, MPL, FLAC,TTA, APE, Dolby TrueHD 等 . 而 面 向<br />

高 清 音 频 标 准 诸 如 EAC3(DD+) 和 DTS-HD 对 音 频 的 压 缩 采 用 7.1 通<br />

道 ,8.1 通 道 甚 至 13.1 通 道 的 要 求 编 码 , 力 求 达 到 音 质 的 完 美 还 原 .<br />

• 面 向 传 输<br />

为 了 进 一 步 提 高 压 缩 率 , 研 究 者 逐 步 深 入 挖 掘 人 耳 的 特 性 , 从 早 期 的<br />

人 耳 带 通 滤 波 技 术 到 现 在 的 心 理 暗 示 自 动 补 偿 技 术 , 深 入 研 究 人 类 的 生<br />

理 特 性 个 信 号 的 参 数 特 性 并 利 用 这 些 特 性 提 高 压 缩 比 是 未 来 研 究 的 方<br />

向 .


Graphical User Interface<br />

Moto Audio Engine<br />

Application Programming Interface(API)<br />

Rate Control<br />

Codec Library<br />

Loudness Control<br />

Equalizer<br />

MP3<br />

eAAC/eAAC+<br />

AVSA<br />

AAC<br />

WMA/WMA<br />

pro<br />

DRA<br />

Sampling Rate Converter<br />

AC3/EAC3<br />

DTS/DTS-HD<br />

Channel Mixer<br />

Vorbis<br />

Others<br />

Other Audio Processing Function<br />

DRM<br />

Demuxer<br />

Hardware Integration Level


End

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!