30.04.2014 Views

NVIDIA CUDA 计算统一设备架构

NVIDIA CUDA 计算统一设备架构

NVIDIA CUDA 计算统一设备架构

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

列<br />

数<br />

(atomic<br />

,atomicAdd() 将 对 function)<br />

元<br />

元<br />

和<br />

访<br />

节<br />

位<br />

位 位<br />

修<br />

写<br />

4.4.3 纹 理 函 数<br />

4.4.3.1 来 自 线 性 存 储 器 的 纹 理<br />

系<br />

template<br />

Type tex1Dfetch(<br />

texture texRef,<br />

int x);<br />

float tex1Dfetch(<br />

texture texRef,<br />

int x);<br />

float tex1Dfetch(<br />

texture texRef,<br />

int x);<br />

float tex1Dfetch(<br />

texture texRef,<br />

int x);<br />

float tex1Dfetch(<br />

texture texRef,<br />

int x);<br />

拾<br />

的<br />

tex1Dfetch() 来 自 线 性 存 储 器 的 纹 理 , 通 过 于 对<br />

函 数 访 问 纹 理 , 示 例 如 下 : 列<br />

float4 tex1Dfetch(<br />

texture texRef,<br />

说 , 这 些 函 数 可 选 择 将 整 型 转 变 为 单 精 度 浮 点 类 型 。 来 型 整 于 对 。 式<br />

int x);<br />

拾<br />

的<br />

4.4.3.2 来 自 <strong>CUDA</strong> 数 组 的 纹 理<br />

x 函 数 会 使 用 纹 理 坐 标 些 这<br />

texRef 定 到 纹 理 参 考 绑 取<br />

线 性 存 储 器 区 域 。 不 支 持 纹 理 过 滤 和 寻 址 模<br />

2 上 述 函 数 以 外 , 还 支 持 了 除<br />

4 和 组<br />

, 示 例 如 下 : 组<br />

template<br />

Type tex1D(texture texRef,<br />

float x);<br />

template<br />

Type tex2D(texture texRef,<br />

float x, float y);<br />

template<br />

Type tex3D(texture texRef,<br />

float x, float y, float z);<br />

和<br />

拾<br />

的<br />

数<br />

x 示 例 将 使 用 纹 理 坐 标 上 以<br />

texRef 定 到 纹 理 参 考 绑 取<br />

性 存 储 器 。 线<br />

<strong>CUDA</strong> 来 自 于 对<br />

tex1D()、tex2D()、tex3D() 纹 理 , 可 通 过 的 组<br />

纹 理 : 问<br />

4.4.4 原 子 函 数<br />

。 纹 理 参 考 的 不 变 ( 编 译 时 ) 和 可 变 ( 运 行 时 ) 属 性 相 互 结 合 , 共 同 确 定 坐 标 的 解 释 方 式 、 在 纹 理 拾 取 过 程 中 发 生 的 处 理 以 及 纹 组<br />

将 结 果 写 回 同 一 地 址 。 之 所 以 说 这 样 的 操 作 是 原 子 的 , 是 因 为 它 可 在 不 干 扰 其 他 线 程 的 前 提 下 执 行 。 换 句<br />

<strong>CUDA</strong> 编<br />

21<br />

x、y 函 数 将 使 用 纹 理 坐 标 些 这<br />

z<br />

texRef 定 到 纹 理 参 考 绑 取<br />

<strong>CUDA</strong><br />

4.3.4.1 取 所 提 供 的 返 回 值 ( 参 见 第 拾 理<br />

第 4.3.4.2<br />

)。<br />

原 子 函 数<br />

32 全 局 或 共 享 存 储 器 内 的 一 个 于 位<br />

或 64<br />

- 行 读 取 执 字<br />

- 入 原 子 改<br />

2.0 南 , 版 本 指 程<br />

操 作 。 例 如<br />

32 局 或 共 享 存 储 器 内 的 某 个 地 址 读 取 全 在<br />

字 , 将 其 与 一 个 整 型 相 加 , 并<br />

说 , 在 操 作 完 成 前 , 其 他 任 何 线 程 都 无 法 访 问 此 地 址 。 话<br />

C 录 附<br />

举 了 受 支 持 的 所 有 原 子 函 数 。 如 附 录 所 述 , 并 非 所 有 设 备 都 支 持 这 些 函 数 。 具 体 来 说 , 计 算 能

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!