30.04.2014 Views

NVIDIA CUDA 计算统一设备架构

NVIDIA CUDA 计算统一设备架构

NVIDIA CUDA 计算统一设备架构

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

和<br />

和<br />

之<br />

,GPU 专<br />

(flow 如 control),<br />

的<br />

专 为 计 算 密 集 型 、 高 度 并 行 化 的 的 设 计 将 更 多 晶 体 管 用 于 数 据 处 理 , 而 非 数 据 缓 存 所 示 。 宽<br />

CPU<br />

CPU<br />

宽 的 每 秒 浮 点 运 算 次 数 和 存 储 器 带 图 1-1.<br />

GPU<br />

图 1-2<br />

GPU 中<br />

GPU<br />

GPU 点 能 力 之 所 以 存 在 这 样 的 差 异 , 原 因 就 在 于 浮 间<br />

,GPU 而 设 计 , 上 图 显 示 的 正 是 这 种 情 况 , 因 而<br />

(caching) 和 流 控 制 算 计<br />

具 体 地 说 有 极 高 的 计 算 密 度 ( 数 学 运 算 与 存 储 器 操 作 的 比 率 )。 由 于 所 有 数 据 元 素 都 执 行 相 同 的 程 序 , 因 此 对 精 密 更<br />

2 <strong>CUDA</strong> 解 决 可 表 示 为 数 据 并 计 算 的 问 题 —— 在 许 多 数 据 元 素 上 并 行 执 行 的 程 序 , 具 流 控 制 的 要 求 高 ; 由 于 在 许 多 数 据 元 素 上 运 行 , 且 具 有 较 高 的 计 算 密 度 , 因 而 可 通 过 计 算 来 隐 藏 存 储 器 访 问 延 迟 , 而 不 必 使 用 较 大 的 数 据 缓 存 。 编<br />

图 1-2.<br />

中 的 更 多 晶 体 管 用 于 数 据 处 理<br />

2.0 南 , 版 本 指 程

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!