的 y)。 的 4.3 通 用 运 行 时 组 件 4.3.1 内 置 向 量 类 型 。 开 4.3.1.1 char1、uchar1、char2、uchar2、char3、uchar3、char4、uchar4、 short1、ushort1、short2、ushort2、short3、ushort3、short4、ushort4、 int1、uint1、int2、uint2、int3、uint3、int4、uint4、long1、ulong1、long2、 主 和 设 备 函 数 均 可 使 用 通 用 运 行 时 组 件 。 宿 ulong2、long3、ulong3、long4、ulong4、float1、float2、float3、float4、 double2 y、z 和 访 int2 make_int2(int x, int y); name> 的 个 4.3.1.2 dim3 类 型 1、2、3、4 向 量 类 型 继 承 自 基 本 整 形 和 浮 点 类 型 。 它 们 均 为 结 构 体 , 第 些 这 量 分 别 可 通 过 字 段 x、 分 w make_
、2 分 位 是 的 节 (texture (texture reference) 的 的 fetch) “texture 纹 elements( 类 且 。 ;Type 仅 。 或 和 位 1.0], 有 节 和 节 (texture 将 coordinate) 节 1.0], 例 和 和 ,1.25 “wrap” 的 寻 或 。Wrap 的 的 间 节 第 的 围 。 对 于 4.3.4 纹 理 类 型 <strong>CUDA</strong> 支 用 数 据 可 带 来 多 方 面 的 性 能 收 益 , 请 参 见 第 5.4 个 参 数 指 定 称 为 纹 理 参 考 对 象 持 GPU 于 图 形 的 纹 理 硬 件 子 集 , 使 之 可 访 问 纹 理 存 储 器 。 从 纹 理 存 储 器 而 非 全 局 存 储 器 读 取 4.3.4.1 纹 理 参 考 声 明 绑 定 到 存 储 器 的 某 些 区 域 ( 即 纹 理 ), 之 后 才 能 供 内 核 。 多 不 同 的 纹 理 参 考 可 绑 定 到 同 一 个 , 也 可 绑 定 到 在 存 储 器 中 存 在 重 叠 的 纹 理 。 纹 理 参 考 有 一 些 属 性 。 其 中 之 一 就 是 其 维 度 , 指 定 纹 理 是 使 用 一 个 纹 理 坐 标 纹 理 作 为 一 维 数 组 寻 址 、 使 用 两 个 纹 理 坐 标 作 为 二 维 数 组 寻 址 , 还 是 使 用 三 个 纹 理 坐 标 作 为 三 维 数 组 寻 址 。 数 组 其 即 内 核 使 用 称 为 纹 理 拾 取 4.4.3 函 数 读 取 纹 理 存 储 器 , 请 参 见 第 备 设 。 纹 理 拾 取 的 第 一 4.5.2.6 参 考 定 义 拾 取 哪 部 分 的 纹 理 存 储 器 。 必 须 通 过 宿 主 运 行 时 函 数 ( 参 见 第 理 纹 第 4.5.3.9 ) 将 他 属 性 定 义 纹 理 拾 取 的 输 入 和 输 出 数 据 类 型 , 并 指 定 如 何 介 绍 输 入 坐 标 、 应 进 行 怎 样 的 处 理 。 其 texture texRef; Type 指 元 素 称 为 texel, 的 元 素 )” 的 简 写 。 理 1 的 义 量 量 和 4 向 量 类 型 ; 量 Dim ReadMode 等 指 分 分 或 是 为 位 理 参 考 的 部 分 属 性 是 不 变 的 , 在 编 译 时 必 须 为 已 知 , 这 些 属 性 是 在 声 明 纹 理 参 考 时 指 定 的 。 纹 理 参 考 在 其 中 : 纹 texture 作 用 域 内 声 明 , 形 式 为 件 文 的 变 量 : 型 定 拾 取 纹 理 时 所 返 回 的 数 据 类 型 4.3.1.1 基 本 整 型 、 单 精 度 浮 点 类 型 和 第 于 限 定 转 换 操 作 ;ReadMode 如 4.3.4.2 运 行 时 纹 理 参 考 属 性 1、2 理 参 考 的 维 度 , 其 值 为 纹 定 3;Dim 个 可 选 的 参 数 , 默 认 值 为 1; 一 于 cudaReadModeNormalizedFloat cudaReadModeElementType; 果 是 cudaReadModeNormalizedFloat, Type 16 或 8 整 型 类 型 , 则 值 将 作 为 浮 点 类 型 返 回 , 对 则 于 所 有 整 型 数 据 而 言 , 无 符 号 整 型 将 映 射 为 [0.0, [-1.0, 整 型 将 映 射 为 号 符 如 , 一 个 0xff 为 值 8 号 符 无 不 执 行 任 何 4.5.3.9 介 N) 范 。 的 它 维 1.0) 的 1)。 一 维 是 N), 因 63] 了 运 行 绍 介 31] 在 对 应 于 坐 标 的 维 度 中 的 大 小 。 范 纹 理 纹 围 理 元 素 将 被 读 取 为 1; 如 果 纹 是 cudaReadModeElementType, 个 可 选 的 参 数 , 默 认 值 为 cudaReadModeElementType。 一 在 归 一 化 的 坐 标 内 , 同 般 情 况 下 , 纹 理 坐 标 与 纹 理 大 小 无 关 , 规 范 化 的 纹 理 坐 标 通 此 <strong>CUDA</strong> (clamp): 编 19 执 行 低 精 度 插 值 。 在 启 用 时 , 视 理 参 考 的 其 他 属 性 是 可 变 的 , 可 通 过 宿 主 运 行 时 在 运 行 时 更 改 ( 们 指 定 纹 理 坐 标 是 否 为 归 一 化 的 滤 , 下 面 将 介 绍 相 关 内 容 围 内 的 浮 点 坐 标 引 用 纹 理 , 其 中 纹 如 , 有 一 个 大 小 例 N 的 (normalized) 第 4.5.2.6 时 API, 了 驱 动 程 序 API)。 绍 , 以 及 寻 址 模 式 和 纹 理 过 理 的 寻 址 范 围 在 x N) 范 [0, 情 况 下 , 使 用 认 默 1.0) 内 使 用 归 一 化 在 被 的 被 为 64x32 x , 在 理 纹 y [0, 用 此 纹 理 时 坐 标 分 别 处 于 引 度 将 被 调 整 到 范 址 往 往 在 纹 理 包 含 周 期 信 号 时 使 用 。 它 仅 使 用 纹 理 值 [0, [0.0, 归 一 化 的 纹 理 坐 标 将 在 。 内 [0, 内 指 定 , 而 非 围 范 一 64x32 寻 址 模 式 足 以 满 足 一 些 应 用 程 序 的 需 求 。 小 常 y [0, 为 均 度 围 [0.0, 2.0 南 , 版 本 指 程 [0, 模 式 定 义 在 纹 理 坐 标 超 出 范 围 时 将 出 现 怎 样 的 情 况 。 在 使 用 非 归 一 化 纹 理 坐 标 时 , 超 出 址 寻 纹 理 坐 标 将 被 调 整 于 0 被 设 置 为 0, 大 于 或 等 值 于 N 被 设 置 为 N-1。 值 0.0 坐 标 时 , 默 认 寻 址 模 式 也 是 调 整 坐 标 : 小 于 理 纹 1.0 于 大 为 0.75. 一 化 坐 标 , 也 可 指 定 坐 标 的 一 部 分 , 例 如 归 视 为 0.25,-1.25 texel 纹 理 过 滤 只 能 对 配 置 为 返 回 浮 点 数 据 的 纹 理 进 行 。 这 将 在 相 邻 性 线
- Page 1 and 2: 程 指 南 , 版 NVIDIA CUDA 计
- Page 3 and 4: 目 录 1 2 3 第 第 4 iii .......
- Page 5 and 6: 程 指 南 , 版 5.3 5.4 5.5 6.1
- Page 7 and 8: 核 (manycore) 众 程 指 南 ,
- Page 9 and 10: 渲 程 指 南 , 版 的 第 列
- Page 11 and 12: 程 指 南 , 版 变 (shared (intr
- Page 13 and 14: 所 ,CUDA (host) 假 memory)。 因
- Page 15 and 16: 提 (compute 由 capability) 。
- Page 17 and 18: 所 块 位 (constant (texture (tex
- Page 19 and 20: 编 的 ,C 标 限 (host) (function
- Page 21 and 22: 节 变 和 助 变 (implied (segme
- Page 23: 工 代 语 ,__device__ 函 对 块
- Page 27 and 28: 列 数 (atomic ,atomicAdd() 将
- Page 29 and 30: Direct3D 互 。 节 和 函 节 ,D
- Page 31 and 32: 的 分 个 、cudaMallocPitch()
- Page 33 and 34: 定 类 ,cudaFilterModeLinear 是
- Page 35 and 36: mode) emulation 是 用 (printf() :
- Page 37 and 38: 节 函 。cuCtxPopCurrent() 上 (u
- Page 39 and 40: 。hostPtr copyParam.srcDevice = de
- Page 41 and 42: 创 填 程 指 南 , 版 上 上
- Page 43 and 44: 块 器 延 迟 。 的 (if、switc
- Page 45 and 46: warp , 当 半 块 中 的 线 程
- Page 47 and 48: 存 未 为 计 程 指 南 , 版
- Page 49 and 50: 字 字 存 存 ,type 计 (Common
- Page 51 and 52: 块 和 展 个 的 位 ,warp 块
- Page 53 and 54: 位 的 线 性 寻 址 。 字 程
- Page 55 and 56: 的 。 个 使 用 广 播 机 制
- Page 57 and 58: 节 位 数 之 节 节 或 (locali
- Page 59 and 60: 相 所 选 ,Csub 等 更 高 的
- Page 61 and 62: ,Muld() 将 的 将 相 的 程 指
- Page 63 and 64: 的 节 节 节 附 录 A 技 术
- Page 65 and 66: (round-towards-zero), : (denormaliz
- Page 67 and 68: 程 指 南 , 版 内 间 外 距
- Page 69 and 70: 后 后 后 后 程 指 南 , 版
- Page 71 and 72: 和 映 位 位 程 指 南 , 版
- Page 73 and 74: 位 程 指 南 , 版 处 位 计
- Page 75 and 76:
≤ 寻 的 × 是 × 是 节 个
- Page 77 and 78:
程 指 南 , 版 使 用 线 性