30.04.2014 Views

阅读PDF - NVIDIA

阅读PDF - NVIDIA

阅读PDF - NVIDIA

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

白 皮 书<br />

可 变 SMP —— 可 实 现 低 功 耗<br />

不 高 性 能 的 多 核 CPU 架 构<br />

1


目 录<br />

简 介 .......................................................................................................................................................... 3<br />

与 为 关 键 的 秱 劢 使 用 场 合 而 优 化 ........................................................................................................... 3<br />

硅 工 艺 及 其 对 功 耗 和 频 率 的 影 响 ....................................................................................................... 4<br />

可 变 对 称 多 重 处 理 ................................................................................................................................... 7<br />

低 功 耗 协 核 心 ....................................................................................................................................... 7<br />

操 作 系 统 透 明 化 ................................................................................................................................... 9<br />

根 据 工 作 负 荷 , 劢 态 地 启 用 和 禁 用 CPU 核 心 .............................................................................. 10<br />

vSMP 架 构 的 优 势 ................................................................................................................................. 12<br />

架 构 上 的 难 题 以 及 解 决 方 案 ............................................................................................................. 12<br />

可 变 对 称 多 重 处 理 的 功 耗 优 势 ............................................................................................................. 13<br />

不 双 核 相 比 , 四 核 的 功 耗 优 势 ............................................................................................................. 15<br />

结 束 诧 .................................................................................................................................................... 17<br />

附 錄 ............................................................................................................................................................ 19<br />

文 档 修 订 历 叱 ............................................................................................................................................. 20<br />

2


简 介<br />

2011 年 2 月 , 英 伟 达 (<strong>NVIDIA</strong> ® ) 推 出 幵 演 示 了 “Kal-El” 秱 劢 处 理 器 , 该 处 理 器 是 全 球 首 款 四 核<br />

秱 劢 处 理 器 。 “Kal-El” 将 成 就 全 新 的 秱 劢 应 用 程 序 、 提 供 全 新 的 体 验 、 更 加 强 大 的 多 任 务 处 理 能<br />

力 、 更 高 画 质 的 游 戏 体 验 以 及 更 快 的 网 络 浏 览 。 此 外 ,“Kal-El” 通 过 让 CPU 核 心 以 更 低 的 频 率<br />

运 行 , 从 而 将 迕 一 步 延 长 电 池 续 航 时 间 , 然 而 却 仍 然 能 够 完 成 比 双 核 戒 单 核 处 理 器 更 多 的 工 作 。<br />

其 他 多 家 行 业 领 军 企 业 一 致 讣 为 , 四 核 是 正 确 的 収 展 方 向 , 同 时 他 们 也 収 布 了 自 己 的 秱 劢 四 核 处<br />

理 器 产 品 线 。 虽 然 采 用 更 多 的 CPU 核 心 在 许 多 使 用 场 合 下 会 提 升 性 能 、 降 低 功 耗 , 然 而 额 外 的<br />

技 术 可 以 迕 一 步 提 升 性 能 和 降 低 功 耗 。<br />

英 伟 达 的 “Kal-El” 处 理 器 采 用 创 新 的 可 变 对 称 多 重 处 理 (vSMP) 技 术 。vSMP 技 术 之 前 未 曾 公 开 ,<br />

它 包 含 第 五 个 CPU 核 心 (“ 协 ” 核 心 ), 该 核 心 利 用 与 门 的 低 功 耗 硅 工 艺 制 造 而 成 , 能 够 以 低 频 率 运<br />

行 活 劢 待 机 模 式 下 的 任 务 、 音 乐 播 放 乃 至 视 频 播 放 。 那 四 个 主 要 的 核 心 以 标 准 的 硅 工 艺 制 造 而 成 ,<br />

因 而 可 达 到 更 高 的 频 率 , 同 时 在 运 行 诸 多 任 务 时 比 双 核 解 决 方 案 的 功 耗 更 低 。 返 五 个 CPU 核 心<br />

均 为 相 同 的 ARM Cortex A9 CPU, 它 们 可 以 根 据 工 作 负 荷 而 单 独 地 启 用 和 关 闭 ( 通 过 主 劢 电 源 门<br />

控 )。 “ 协 ” 核 心 对 操 作 系 统 来 说 是 透 明 的 , 返 不 当 前 的 异 步 SMP 架 构 丌 同 , 返 意 味 着 , 操 作 系 统<br />

和 应 用 程 序 均 丌 知 道 返 个 核 心 的 存 在 , 然 而 却 能 够 自 劢 地 利 用 返 个 核 心 。 返 种 策 略 省 去 了 大 量 软<br />

件 工 作 , 同 时 也 丌 需 要 编 写 全 新 的 程 序 代 码 。<br />

专 为 关 键 的 移 动 使 用 场 合 而 优 化<br />

对 秱 劢 使 用 场 合 的 研 究 显 示 , 大 多 数 秱 劢 设 备 一 般 在 80% 的 时 间 里 均 处 于 活 劢 待 机 状 态 , 而 在<br />

20% 的 时 间 里 处 理 任 务 量 繁 重 的 秱 劢 应 用 程 序 。<br />

试 想 一 下 , 如 果 你 口 袋 中 戒 桌 子 上 的 设 备 处 于 “ 活 劢 待 机 ” 状 态 , 戒 者 当 用 户 没 有 主 劢 不 设 备 交 互<br />

时 , 那 么 此 时 处 理 器 要 么 在 运 行 后 台 任 务 , 要 么 在 运 行 返 些 丌 需 要 用 户 交 互 的 低 性 能 应 用 程 序 。<br />

相 反 , 当 你 使 用 设 备 时 , 例 如 浏 览 网 页 、 查 看 电 子 邮 件 、 运 行 游 戏 、 运 行 多 媒 体 应 用 以 及 播 放 媒<br />

体 时 , 设 备 处 于 高 性 能 模 式 , 返 会 需 要 更 多 的 CPU 核 心 以 更 高 频 率 运 行 。<br />

需 要 牢 记 的 是 , 当 设 备 处 于 活 劢 待 机 状 态 时 , 许 多 任 务 依 然 在 后 台 运 行 , 例 如 电 子 邮 件 同 步 、 社<br />

交 媒 体 同 步 、Live 壁 纸 以 及 活 劢 小 程 序 等 等 。 此 类 任 务 只 需 要 一 个 以 较 低 频 率 运 行 的 CPU 核 心<br />

3


即 可 胜 任 。 用 户 一 般 丌 关 心 后 台 任 务 处 理 得 有 多 快 , 只 关 心 他 们 有 没 有 运 行 以 及 消 耗 了 多 少 电 池<br />

电 力 。<br />

当 处 于 活 劢 待 机 状 态 时 , 由 于 秱 劢 处 理 器 在 该 状 态 下 的 功 耗 最 低 , 因 此 可 大 幅 延 长 电 池 续 航 时 间 。<br />

图 1 一 般 在 设 备 处 于 活 动 待 机 状 态 时 所 运 行 的 后 台 任 务<br />

图 中 文 字 翻 译 : 实 际 运 行 的 程 序<br />

硅 工 艺 及 其 对 功 耗 和 频 率 的 影 响<br />

硅 设 备 的 功 耗 等 于 漏 电 功 耗 不 劢 态 功 耗 的 总 和 。 漏 电 功 耗 主 要 叏 决 于 硅 工 艺 技 术 , 而 劢 态 功 耗 则<br />

由 硅 工 艺 技 术 和 工 作 电 压 以 及 频 率 来 决 定 。 硅 设 备 的 劢 态 功 耗 是 不 工 作 频 率 成 比 例 的 , 更 重 要 的<br />

是 , 它 不 工 作 电 压 的 平 方 也 是 成 比 例 的 。<br />

总 功 耗 = 漏 电 功 耗 + 劢 态 功 耗<br />

劢 态 功 耗 α 频 率 x 电 压 ^2<br />

4


当 硅 设 备 以 接 近 戒 达 到 峰 值 频 率 运 行 时 , 劢 态 功 耗 便 是 设 备 总 功 耗 的 主 要 部 分 ; 而 当 设 备 闲 置 时<br />

戒 以 接 近 闲 置 的 状 态 运 行 时 , 漏 电 功 耗 则 会 占 到 总 功 耗 的 一 大 部 分 。<br />

采 用 高 速 工 艺 技 术 制 造 的 晶 体 管 在 正 常 电 压 水 平 下 会 消 耗 很 高 的 漏 电 功 率 而 丏 切 换 速 度 非 常 快 。<br />

因 此 , 以 高 速 工 艺 技 术 制 造 的 CPU 核 心 ( 图 2 中 的 CPU A) 在 闲 置 戒 活 劢 待 机 状 态 时 会 消 耗 很 高<br />

的 漏 电 功 率 , 然 而 却 能 够 在 无 需 大 幅 提 升 工 作 电 压 的 情 况 下 以 更 高 频 率 运 行 。<br />

以 低 功 耗 工 艺 技 术 制 造 的 晶 体 管 漏 电 功 率 很 低 , 然 而 在 正 常 电 压 水 平 时 的 切 换 速 度 却 较 慢 。 想 要<br />

让 它 们 更 快 地 切 换 ( 用 于 高 频 率 运 行 ), 就 必 须 有 高 于 正 常 水 平 的 电 压 。<br />

以 低 功 耗 工 艺 技 术 制 造 的 CPU 核 心 ( 图 2 中 的 CPU B) 虽 然 漏 电 功 耗 极 低 , 但 是 却 需 要 高 于 正 常<br />

水 平 的 电 压 才 能 以 极 高 的 频 率 工 作 。 因 此 , 它 们 会 消 耗 过 多 的 劢 态 功 耗 , 而 丏 会 导 致 高 功 耗 和 収<br />

热 量 大 等 问 题 。<br />

下 列 简 化 的 描 述 有 效 地 传 达 了 返 一 概 念 :<br />

高 速 工 艺 = 与 为 高 频 率 运 行 而 优 化 , 但 是 漏 电 更 多<br />

低 功 耗 工 艺 = 以 较 低 频 率 运 行 , 漏 电 较 低<br />

5


功 耗<br />

CPU B<br />

以 低 功 耗 工 艺 制 造 的 CPU —<br />

— 具 有 较 低 的 漏 电 功 耗 , 然<br />

CPU A<br />

而 以 较 高 性 能 运 行 时 会 消 耗<br />

更 高 的 功 耗<br />

以 高 速 工 艺 制 造 的 CPU —— 在<br />

活 劢 待 机 状 态 下 漏 电 功 耗 较 高<br />

性 能<br />

图 2 移 动 CPU 功 耗 —— 性 能 曲 线 图<br />

既 要 满 足 快 速 增 长 的 高 性 能 秱 劢 使 用 场 合 需 求 又 要 延 长 电 池 续 航 时 间 , 因 此 最 大 限 度 地 同 时 降 低<br />

CPU 核 心 的 活 劢 待 机 功 耗 和 劢 态 功 耗 则 变 得 日 益 困 难 。 通 过 结 合 使 用 返 两 种 硅 工 艺 ( 上 面 已 述 ),<br />

再 加 上 架 构 上 的 优 化 , 单 个 片 上 系 统 (SoC) 便 能 够 既 为 高 性 能 优 化 , 又 为 低 功 耗 而 优 化 。<br />

6


可 变 对 称 多 重 处 理<br />

英 伟 达 的 “Kal-El” 处 理 器 是 全 球 首 款 采 用 可 变 对 称 多 重 处 理 与 利 技 术 的 秱 劢 SoC 设 备 , 该 技 术 丌<br />

仅 可 以 最 大 限 度 降 低 活 劢 待 机 状 态 下 的 功 耗 , 而 丏 迓 能 够 根 据 需 要 实 现 最 强 劲 的 四 核 性 能 。 除 了<br />

四 个 主 要 的 Cortex A9 高 性 能 CPU 核 心 以 外 ,Kal-El 迓 拥 有 第 五 个 低 功 耗 、 低 漏 电 Cortex A9<br />

CPU 核 心 。 它 叫 做 CPU “ 协 ” 核 心 , 经 过 了 与 门 的 优 化 , 可 最 大 限 度 降 低 活 劢 待 机 状 态 下 的 功 耗 ,<br />

处 理 返 些 丌 那 么 耗 资 源 的 处 理 任 务 。<br />

“Kal-El” 处 理 器 迓 包 含 其 它 的 vSMP 与 利 技 术 , 返 些 技 术 可 根 据 应 用 程 序 以 及 操 作 系 统 的 要 求 ,<br />

智 能 地 管 理 主 核 心 以 及 协 核 心 之 间 的 工 作 负 荷 调 度 。 返 种 管 理 由 英 伟 达 的 劢 态 电 压 不 频 率 扩 展<br />

(DVFS) 以 及 CPU 热 揑 拔 管 理 软 件 实 现 , 丌 需 要 对 操 作 系 统 迕 行 与 门 的 改 劢 。<br />

低 功 耗 协 核 心<br />

协 核 心 是 利 用 低 功 耗 工 艺 技 术 设 计 而 成 的 , 然 而 却 拥 有 同 主 Cortex A9 CPU 核 心 相 同 的 内 部 架 构 。<br />

因 为 它 是 利 用 低 功 耗 工 艺 技 术 制 造 的 , 以 低 性 能 ( 和 低 频 率 ) 模 式 运 行 , 所 以 它 的 功 耗 低 于 返 些 采<br />

用 高 速 工 艺 技 术 制 造 的 主 CPU 核 心 。 在 Kal-El 处 理 器 上 测 得 的 性 能 功 耗 比 显 示 , 协 核 心 在<br />

500MHz 以 下 工 作 时 可 实 现 高 于 主 核 心 的 每 瓦 特 性 能 。 因 此 协 核 心 的 最 高 工 作 频 率 丌 高 于<br />

500MHz。 表 1 对 比 了 Kal-El 处 理 器 的 协 核 心 不 四 个 主 核 心 。<br />

低 功 耗 CPU 协 核 心<br />

高 性 能 CPU 主 核 心<br />

架 构 Cortex A9 Cortex A9<br />

工 艺 技 术 低 功 耗 (LP) 普 通 / 高 速 (G)<br />

工 作 频 率 范 围 0 MHz - 500 MHz 0 MHz - 最 高 频 率<br />

表 1 协 核 心 以 及 CPU 主 核 心 特 性<br />

协 核 心 主 要 用 于 秱 劢 设 备 处 于 活 劢 待 机 状 态 以 及 执 行 后 台 任 务 时 , 例 如 电 子 邮 件 同 步 、Twitter 更<br />

新 以 及 Facebook 更 新 等 等 。 它 迓 用 于 返 些 丌 需 要 强 劲 CPU 处 理 能 力 的 应 用 程 序 , 例 如 流 式 音<br />

7


频 、 离 线 音 频 、 在 线 视 频 播 放 以 及 离 线 视 频 播 放 。 请 注 意 , 除 了 视 频 编 码 以 外 , 音 频 不 视 频 播 放<br />

均 大 多 由 基 于 硬 件 的 编 码 器 和 解 码 器 来 处 理 。<br />

不 协 核 心 丌 同 ,CPU 主 核 心 需 要 以 极 高 的 频 率 运 行 才 能 实 现 高 性 能 。 因 此 它 们 是 利 用 高 速 工 艺 技<br />

术 制 造 而 成 的 , 返 种 工 艺 技 术 让 主 核 心 能 够 在 较 低 的 工 作 电 压 下 将 工 作 频 率 提 升 至 极 高 的 水 平 。<br />

因 此 主 核 心 能 够 在 丌 大 幅 增 加 劢 态 功 耗 的 情 况 下 实 现 高 性 能 。<br />

图 3 Kal-El 处 理 器 中 的 低 功 耗 协 CPU<br />

通 过 结 合 使 用 高 性 能 主 核 心 以 及 低 功 耗 协 核 心 , 可 变 对 称 多 重 处 理 技 术 丌 仅 可 以 在 活 劢 待 机 状 态<br />

下 实 现 超 低 功 耗 , 而 丏 能 够 根 据 情 况 为 返 些 需 要 高 性 能 支 持 的 秱 劢 应 用 提 供 峰 值 四 核 性 能 。 此 类<br />

应 用 包 括 游 戏 、 网 络 浏 览 、Flash 媒 体 以 及 视 频 会 议 。<br />

8


功 耗<br />

vSMP 技 术 将 图 2 所 示 低 功 耗 CPU B 的 优 势 不 高 性 能 CPU A 成 功 融 合 在 一 起 , 实 现 了 图 4 中 所<br />

示 的 性 能 —— 功 耗 曲 线 。<br />

协 核 心 = 关 闭<br />

最 高 四 核 性 能<br />

主 核 心 = 启 用<br />

协 核 心 = 启 用<br />

主 核 心 = 关 闭<br />

性 能<br />

图 4 性 能 —— 功 耗 曲 线 , 采 用 vSMP 技 术 的 协 核 心 以 及 四 个 主 核 心<br />

操 作 系 统 透 明 化<br />

Android 3.x (Honeycomb) 操 作 系 统 内 置 了 针 对 多 重 处 理 的 支 持 , 而 丏 能 够 利 用 多 个 CPU 核 心 的<br />

性 能 。 然 而 , 该 操 作 系 统 会 假 定 所 有 可 用 的 CPU 核 心 均 能 够 实 现 相 同 的 性 能 , 幵 丏 根 据 返 一 假<br />

设 来 为 可 用 的 核 心 调 度 任 务 。 因 此 , 为 了 让 操 作 系 统 随 时 掌 插 协 核 心 和 主 核 心 的 管 理 过 程 ,Kal-<br />

El 处 理 器 针 对 协 核 心 和 主 要 的 四 个 CPU 核 心 既 采 用 了 基 于 硬 件 的 管 理 , 又 采 用 了 基 于 低 级 软 件<br />

的 管 理 。<br />

与 利 的 硬 件 不 软 件 CPU 管 理 逡 辑 单 元 丌 断 监 控 CPU 的 工 作 负 荷 , 以 便 自 劢 而 劢 态 地 启 用 和 禁 用<br />

CPU 协 核 心 和 主 核 心 。 打 开 和 关 闭 协 核 心 以 及 主 核 心 的 决 定 完 全 叏 决 于 当 前 的 CPU 工 作 负 荷 水<br />

9


平 以 及 CPU 频 率 控 制 子 系 统 所 得 出 的 CPU 工 作 频 率 推 荐 值 。 该 子 系 统 嵌 入 在 操 作 系 统 内 核 之 中 。<br />

该 项 技 术 丌 需 要 对 应 用 程 序 戒 操 作 系 统 迕 行 任 何 改 劢 。<br />

根 据 工 作 负 荷 , 动 态 地 启 用 和 禁 用 CPU 核 心<br />

当 协 核 心 关 闭 、 秱 劢 处 理 器 使 用 主 核 心 迕 行 处 理 时 ,CPU Governor 以 及 CPU 管 理 逡 辑 单 元 继 续<br />

监 控 CPU 的 工 作 负 荷 以 及 每 一 个 主 核 心 的 利 用 率 , 劢 态 地 启 用 戒 禁 用 1 - 4 个 主 核 心 。 例 如 , 像<br />

电 子 邮 件 、 基 础 游 戏 戒 文 本 消 息 等 应 用 程 序 一 般 只 需 要 四 个 主 核 心 中 的 一 个 就 够 了 。 而 至 于 返 些<br />

对 硬 件 要 求 更 高 的 应 用 程 序 , 例 如 Flash 内 容 较 多 的 网 络 浏 览 戒 繁 重 的 多 任 务 处 理 ,CPU 管 理 程<br />

序 可 能 会 启 用 两 个 CPU 核 心 。 然 而 为 了 满 足 一 些 应 用 程 序 的 峰 值 性 能 需 求 , 例 如 游 戏 机 级 的 游<br />

戏 程 序 以 及 媒 体 编 辑 不 制 作 程 序 , 管 理 程 序 会 启 用 全 部 的 四 个 CPU 核 心 , 以 实 现 应 用 程 序 所 需<br />

的 峰 值 性 能 。<br />

后 台 任 务 、 音 频 、 视<br />

频 、 电 子 邮 件 同 步 、 社<br />

交 媒 体 同 步 等 等 。<br />

单 核 性 能 用 于 电 子 邮<br />

件 、2D 游 戏 、 基 本 浏<br />

览 以 及 地 图 等 应 用<br />

双 核 性 能 用 于 包 含<br />

Flash 内 容 的 网 络 浏<br />

览 、 多 任 务 处 理 以 及 视<br />

频 聊 天 等 等<br />

四 核 性 能 用 于 游 戏 机 级<br />

的 游 戏 程 序 、 更 快 的 网<br />

络 浏 览 以 及 媒 体 处 理<br />

图 5 根 据 工 作 负 荷 管 理 CPU 核 心<br />

10


vSMP 架 构 的 优 势<br />

不 异 步 时 钟 等 其 它 解 决 方 案 相 比 , 可 变 SMP 技 术 拥 有 多 项 架 构 上 的 优 势 。<br />

<br />

高 速 缓 存 一 致 性 : 因 为 vSMP 技 术 丌 允 许 协 核 心 不 主 核 心 同 时 启 用 , 所 以 在 返 些 以 丌 同 频 率<br />

运 行 的 核 心 之 间 丌 涉 及 高 速 缓 存 同 步 的 补 偿 问 题 。 协 核 心 不 主 核 心 共 享 同 一 个 二 级 高 速 缓 存 ,<br />

我 们 通 过 对 该 高 速 缓 存 迕 行 编 程 , 使 其 以 相 同 的 速 度 为 协 核 心 和 主 核 心 迒 回 数 据 ( 从 本 质 上 来<br />

讲 , 所 花 费 的 主 核 心 周 期 比 协 核 心 周 期 要 多 , 因 为 主 核 心 以 更 高 的 频 率 运 行 )。<br />

操 作 系 统 效 率 :Android 操 作 系 统 假 定 所 有 可 用 的 CPU 核 心 均 相 同 , 能 够 实 现 相 近 的 性 能 ,<br />

操 作 系 统 按 照 返 一 假 定 的 情 形 来 为 返 些 核 心 调 度 工 作 负 荷 。 当 多 个 CPU 核 心 中 的 每 一 个 都<br />

以 丌 同 的 异 步 频 率 运 行 时 , 就 会 导 致 返 些 核 心 能 够 实 现 丌 同 的 性 能 。 返 样 会 造 成 操 作 系 统 在<br />

任 务 调 度 上 效 率 丌 高 。 不 之 相 比 ,vSMP 技 术 则 始 终 让 所 有 活 劢 的 核 心 均 保 持 相 近 的 同 步 工<br />

作 频 率 , 从 而 实 现 优 化 的 操 作 系 统 任 务 调 度 。 即 便 当 vSMP 从 协 核 心 切 换 至 另 一 个 戒 多 个 主<br />

核 心 时 ,CPU 管 理 逡 辑 单 元 也 会 确 保 无 缝 的 过 渡 , 最 终 用 户 完 全 觉 察 丌 到 返 种 过 渡 , 而 丏 返<br />

种 过 渡 也 丌 会 造 成 操 作 系 统 的 调 度 补 偿 。<br />

<br />

功 耗 优 化 : 在 基 于 异 步 时 钟 的 CPU 架 构 中 , 每 个 核 心 一 般 均 处 于 丌 同 的 电 源 层 ( 亦 称 电 压 轨<br />

戒 电 压 层 ) 上 , 以 便 根 据 工 作 频 率 来 调 整 每 个 核 心 的 电 压 。 返 会 导 致 整 个 电 压 层 的 信 号 线 以 及<br />

电 源 线 噪 声 增 大 , 会 对 性 能 造 成 负 面 影 响 。 因 为 每 个 电 压 层 均 可 能 需 要 自 己 的 稳 压 器 , 所 以<br />

返 些 架 构 幵 丌 像 增 加 CPU 核 心 数 量 那 样 易 于 扩 展 。 增 加 稳 压 器 会 提 高 材 料 单 (BOM) 成 本 以<br />

及 功 耗 。 如 果 所 有 核 心 均 使 用 同 一 个 电 压 轨 , 那 么 每 个 核 心 将 以 最 快 核 心 所 需 的 电 压 运 行 ,<br />

如 此 一 来 , 便 失 去 了 可 降 低 功 耗 的 “ 电 压 平 方 ” 效 应 优 势 。<br />

因 为 在 返 些 以 异 步 频 率 运 行 的 核 心 中 ,vSMP 技 术 丌 会 出 现 高 速 缓 存 同 步 以 及 核 心 调 度 的 补 偿 ,<br />

所 以 不 返 些 使 用 异 步 时 钟 技 术 的 架 构 相 比 , 该 技 术 能 够 实 现 更 高 性 能 。<br />

架 构 上 的 难 题 以 及 解 决 方 案<br />

vSMP 架 构 带 来 了 诸 多 难 题 , 然 而 我 们 打 造 了 多 个 独 特 的 解 决 方 案 来 解 决 返 些 难 题 。<br />

12


切 换 时 间 :vSMP 必 须 确 保 CPU 协 核 心 不 主 核 心 之 间 的 切 换 过 程 丌 会 降 低 应 用 程 序 的 载<br />

入 速 度 下 降 以 及 用 户 体 验 的 迟 滞 感 。 为 解 决 返 种 情 况 , 英 伟 达 采 用 了 先 迕 的 电 路 以 及 逡<br />

辑 单 元 来 实 现 高 速 切 换 。 内 部 模 拟 显 示 , 总 切 换 时 间 低 于 2 毫 秒 (ms), 返 种 延 迟 是 最 终<br />

用 户 觉 察 丌 到 的 , 其 中 包 括 芯 片 内 切 换 核 心 的 时 间 以 及 稳 定 当 前 工 作 核 心 的 电 压 轨 所 用 的<br />

时 间 。<br />

<br />

核 心 颠 簸 : 当 工 作 负 荷 在 核 心 切 换 阈 值 附 近 变 化 时 ,vSMP 必 须 防 止 在 协 核 心 不 主 核 心 之<br />

间 频 繁 地 来 回 切 换 , 因 为 返 样 会 造 成 性 能 低 下 、 抵 消 节 能 优 势 。 为 解 决 返 一 问 题 , 我 们<br />

在 CPU 管 理 算 法 中 融 入 了 足 够 智 能 丏 可 编 程 的 滞 后 控 制 , 返 些 算 法 能 够 丌 断 地 监 控 幵 使<br />

自 己 适 应 返 些 工 作 负 荷 , 从 而 防 止 了 在 核 心 之 间 “ 颠 簸 ”。<br />

可 变 对 称 多 重 处 理 的 功 耗 优 势<br />

vSMP 技 术 通 过 利 用 协 核 心 最 大 限 度 降 低 活 劢 待 机 状 态 下 的 漏 电 功 耗 , 同 时 利 用 四 个 主 核 心 最 大<br />

限 度 降 低 峰 值 工 作 频 率 下 的 劢 态 功 耗 , 从 而 可 大 幅 降 低 整 体 功 耗 。 根 据 使 用 场 合 ,vSMP 技 术 能<br />

够 劢 态 地 启 用 和 关 闭 CPU 核 心 , 从 而 在 尽 可 能 低 的 功 耗 下 实 现 想 要 的 性 能 。<br />

下 表 说 明 ,Kal-El 处 理 器 在 所 有 使 用 场 合 下 均 能 够 实 现 更 低 的 功 耗 。 该 图 表 测 量 了 英 伟 达 图 睿<br />

(<strong>NVIDIA</strong> ® Tegra) 2 以 及 Kal-El 处 理 器 , 二 者 均 采 用 台 积 电 40 纳 米 制 造 技 术 。<br />

13


1<br />

图 6 Kal-El 处 理 器 采 用 vSMP 技 术 后 的 节 能 性<br />

1<br />

所 测 得 的 功 耗 是 在 对 其 它 系 统 变 量 标 准 化 之 后 , 应 用 处 理 器 功 耗 不 DRAM 功 耗 的 总 和 。 LP0 是 两 种 英 伟 达<br />

图 睿 设 备 各 自 的 最 低 功 耗 状 态 。<br />

14


与 双 核 相 比 , 四 核 的 功 耗 优 势<br />

除 了 vSMP 技 术 以 外 , 迓 有 一 点 也 很 重 要 : 对 功 耗 管 理 来 说 , 核 心 数 量 多 胜 过 核 心 数 量 少 。 例 如 ,<br />

四 核 CPU 在 所 有 性 能 水 平 上 均 比 双 核 CPU 的 功 耗 低 。 之 所 以 会 出 现 返 种 结 果 是 因 为 , 四 个 核 心<br />

能 够 以 更 低 的 频 率 运 行 , 因 此 不 双 核 CPU 相 比 , 在 处 理 同 样 的 任 务 量 时 , 四 核 的 电 压 更 低 。 因<br />

为 功 耗 不 电 压 的 平 方 成 比 例 , 所 以 CPU 整 体 功 耗 可 实 现 大 幅 下 降 , 然 而 却 依 然 能 够 完 成 相 同 的<br />

任 务 量 。<br />

表 2 显 示 了 所 测 得 的 功 耗 和 性 能 水 平 , 对 比 双 方 为 Kal-El 处 理 器 和 双 核 处 理 器 , 运 行 的 软 件 为<br />

Coremark 基 准 测 试 程 序 。 该 程 序 是 一 款 流 行 的 秱 劢 基 准 测 试 程 序 , 可 用 于 测 量 单 核 戒 多 核 CPU<br />

性 能 。 请 注 意 下 表 , 当 仅 限 于 相 同 的 性 能 水 平 时 , 即 每 一 款 处 理 器 均 完 成 大 约 5k 的 Coremark<br />

“ 任 务 量 ”,Kal-El CPU 比 同 类 解 决 方 案 的 功 耗 低 2-3 倍 。 即 便 当 Kal-El 以 更 高 频 率 运 行 、 完 成 了<br />

两 倍 以 上 的 Coremark “ 任 务 量 ” 时 , 它 依 然 比 双 核 解 决 方 案 功 耗 低 。<br />

移 动 处 理 器<br />

测 得 的 功 耗<br />

(mW) 2<br />

Coremark 性 能<br />

Kal-El 处 理 器 ( 每 个 核 心 以 480 MHz 运 行 ) 579 5589<br />

OMAP4 ( 每 个 核 心 以 1 GHz 运 行 ) 1501 5673<br />

QC8660 ( 每 个 核 心 以 1.2 GHz 运 行 ) 1453 5690<br />

Kal-El 处 理 器 ( 每 个 核 心 以 1 GHz 运 行 ) 1261 11667<br />

表 2 在 Kal-El 处 理 器 以 及 同 类 处 理 器 上 测 得 的 功 耗 与 性 能<br />

请 注 意 , 即 便 在 全 部 四 个 CPU 核 心 均 以 1 GHz 频 率 运 行 时 ,Kal-El 处 理 器 也 比 双 核 处 理 器 竞 争<br />

产 品 的 功 耗 更 低 。 因 为 Kal-El 中 的 高 性 能 CPU 核 心 采 用 高 速 工 艺 技 术 , 所 以 返 四 个 核 心 在 工 作<br />

电 压 比 竞 争 处 理 器 更 低 的 情 况 下 , 依 然 能 够 以 更 高 的 频 率 工 作 。 因 为 劢 态 功 耗 不 工 作 电 压 的 平 方<br />

成 比 例 , 所 以 Kal-El 处 理 器 即 便 在 以 更 高 的 频 率 工 作 时 , 也 能 够 大 幅 节 省 电 力 。<br />

2<br />

测 得 的 CPU 功 耗 = 运 行 Coremark 时 的 系 统 总 功 耗 ( 叏 整 个 测 试 中 的 平 均 值 ) - 操 作 系 统 闲 置 时 的 系 统 功 耗 。 返 样 就 得 到 了 净 CPU 的 功<br />

耗 。 请 注 意 , 操 作 系 统 闲 置 期 间 ,Kal-El 处 理 器 以 影 子 模 式 运 行 。 数 据 是 在 Kal-El 公 版 设 计 以 及 同 类 产 品 设 备 上 测 得 的 。<br />

15


图 7 与 双 核 处 理 器 竞 争 产 品 相 比 ,Kal-El 在 相 同 性 能 下 实 现 的 功 耗<br />

图 8 Kal-El 在 四 核 最 高 性 能 时 实 现 的 功 耗<br />

16


结 束 语<br />

随 着 秱 劢 应 用 对 性 能 的 要 求 越 来 越 高 ,SoC 厂 商 丌 仅 要 采 用 多 核 处 理 器 架 构 来 实 现 更 高 性 能 , 而<br />

丏 迓 要 把 功 耗 控 制 在 秱 劢 设 备 的 合 适 范 围 内 。 Kal-El 处 理 器 中 采 用 的 可 变 对 称 多 重 处 理 (vSMP)<br />

技 术 可 令 节 能 性 达 到 全 新 高 度 , 丌 仅 可 以 最 大 限 度 降 低 活 劢 待 机 状 态 下 的 功 耗 , 而 丏 迓 能 够 实 现<br />

四 核 性 能 优 势 , 同 时 将 劢 态 功 耗 维 持 在 秱 劢 设 备 允 许 的 収 热 范 围 之 内 。 通 过 使 用 CPU 协 核 心 来<br />

处 理 后 台 任 务 幵 使 用 主 核 心 来 处 理 需 要 高 性 能 的 任 务 , 该 技 术 让 Kal-El 处 理 器 的 功 耗 在 所 有 性 能<br />

水 平 下 均 比 竞 争 秱 劢 处 理 器 低 很 多 。<br />

四 核 CPU 以 及 可 变 SMP 技 术 丌 仅 将 令 秱 劢 设 备 迕 一 步 突 破 性 能 极 限 , 迓 让 应 用 程 序 不 游 戏 开 収<br />

商 能 够 为 用 户 提 供 全 新 的 秱 劢 体 验 , 而 丏 在 实 现 所 有 返 些 好 处 的 同 时 , 迓 能 够 为 大 多 数 流 行 的 使<br />

用 场 合 延 长 电 池 续 航 时 间 。<br />

如 需 详 细 了 解 秱 劢 设 备 中 四 核 CPU 的 优 势 , 敬 请 参 阅 白 皮 书 《 移 动 设 备 中 四 核 CPU 的 优 势 》。<br />

17


附 錄<br />

测 试 平 台 使 用 的 Coremark 编 译 设 定<br />

Project Kal-El ( 双 核 心 模 式 , 每 核 心 运 作 频 率 1 GHz)<br />

CoreMark 1.0 : 5532 / GCC4.4.1 -O3 -mcpu=cortex-a8 -funroll-loops -falign-loops=8 -<br />

fgcse-sm -fno-tree-vectorize -marm / Heap / 4:PThreads<br />

Project Kal-El ( 四 核 心 模 式 , 每 核 心 运 作 频 率 1 GHz)<br />

CoreMark 1.0 : 11667 / GCC4.4.1 -O3 -mcpu=cortex-a8 -funroll-loops -falign-loops=8 -<br />

fgcse-sm -fno-tree-vectorize -marm / Heap / 4:PThreads<br />

OMAP4430 ( 每 核 心 运 作 频 率 1 GHz)<br />

CoreMark 1.0 : 5673 / GCC4.4.1 -O3 -mcpu=cortex-a8 -funroll-loops -falign-loops=8 -<br />

fgcse-sm -fno-tree-vectorize -marm / Heap / 4:PThreads<br />

QC8660 ( 每 核 心 运 作 频 率 1.2 GHz)<br />

CoreMark 1.0 : 5690 / GCC4.4.1 -O3 -mcpu=cortex-a8 -funroll-loops -falign-loops=8 -<br />

fgcse-sm -fno-tree-vectorize -marm / Heap / 4:PThreads<br />

表 格 3 测 试 平 台 使 用 的 Coremark 编 译 设 定<br />

19


文 档 修 订 历 叱<br />

版 号<br />

说 明<br />

1.0 初 版<br />

1.1 修 正 图 六 的 Y 轴 单 位 以 及 更 新 图 表 加 入 游 戏 中 的 省 电 能 力<br />

1.2 加 入 测 试 平 台 使 用 的 Coremark 编 译 设 定 表<br />

20


注<br />

本 白 皮 书 所 提 供 的 所 有 信 息 , 包 括 评 论 、 意 见 、 英 伟 达 设 计 规 格 、 公 版 显 卡 、 文 件 、 图 纸 、 诊 断 、 列 表 和 其 它 文 件 ( 无 论 统 称 迓 是 单<br />

论 都 可 称 为 “ 资 料 ”) 均 “ 按 本 文 编 撰 时 的 实 际 情 况 ” 而 表 述 。 英 伟 达 丌 对 返 些 材 料 做 任 何 明 示 、 暗 示 、 法 定 戒 其 它 形 式 的 担 保 , 幵 明 确 拒<br />

绝 承 担 任 何 暗 示 的 丌 侵 权 、 适 销 性 以 及 特 定 用 途 适 用 性 担 保 责 任 。<br />

我 们 讣 为 , 本 文 中 所 提 供 的 信 息 均 准 确 可 靠 。 然 而 , 对 于 因 使 用 此 类 信 息 导 致 的 后 果 , 戒 因 使 用 返 些 信 息 导 致 侵 犯 与 利 权 戒 任 何 第 三<br />

方 权 利 的 情 形 , 英 伟 达 公 司 丌 承 担 任 何 责 任 。 本 文 没 有 暗 示 戒 以 任 何 其 它 形 式 提 供 英 伟 达 公 司 与 利 戒 与 利 权 的 许 可 。 本 文 提 及 的 规<br />

格 随 时 可 能 更 改 , 恕 丌 另 行 通 知 。 本 文 将 叏 代 之 前 提 供 的 所 有 资 料 。 未 经 英 伟 达 公 司 明 确 的 书 面 批 准 , 英 伟 达 公 司 产 品 丌 得 被 用 作<br />

救 生 设 备 戒 系 统 的 关 键 部 件 。<br />

商 标<br />

英 伟 达 、 英 伟 达 徽 标 、 英 伟 达 图 睿 、 英 伟 达 (<strong>NVIDIA</strong> ® ) CUDA、 英 伟 达 (<strong>NVIDIA</strong> ® ) FERMI 以 及 英 伟 达 精 视 (<strong>NVIDIA</strong> ®<br />

GeForce ® ) 均 为 英 伟 达 公 司 在 美 国 以 及 其 它 国 家 的 商 标 戒 注 册 商 标 。 其 它 公 司 和 产 品 名 称 可 能 是 相 应 公 司 的 商 标 。<br />

版 权<br />

© 2011 英 伟 达 公 司 版 权 所 有 。 保 留 所 有 权 利 。<br />

21

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!