NVIDIA CUDA è®¡ç®ç»ä¸è®¾å¤æ¶æ

More documents

Recommendations

Info

图表目录 CPU 1-2. 图和 GPU 2-1. .......................................... 程块网格图中线存异的更多晶体管用于数据处的 ...... ......... ..... .............. .....................2 宽 ...... .............. .......... .............. .............. .....................2 理 ....... ..................... ...................................................6 器层次结储 CUDA ................................................................... 型软硬库 2-2. 2-3. 2-4. 3-1. 4-1. 5-1. 5-2. 存图 ................................. .............. ...................................................................7 构 ............. .............. .............. ....................................8 ................ .............. .............. ..................... .............. .. ...................................9 栈 .............. ...........................................11 ......................................................... 理 .............. ....... ......... ...........................31 ................... 例 .............. .............. .............. .. ........ ..40 .... 例 ............................................... 程件件模构编文管储器合并后的存储器访问模式示为计算能力设备进行存储器合并的全局存储器访问模式示上下的或未计无无 1.0 或是 41 ... .42 例 1.1 .............. .............. .............. ...............48 用广播机制的共享存储器读取访问模式示有 5-8. 使图矩 ..... .............. ............ .. .. .........43 例 .............. .............. .............. .............. ......46 .............. .............. .............. .............. ......47 ... .............. .............. .............. ...............49 例 ........................................................... .............. .............. ....................................53 法图 1-1. GPU 每秒浮点运算次数和存储器带图 5-3. 1.0 算能力是计为 1.1 设备进行存储器合并的全局存储器访问模式示图 5-5. ... 体冲突的共享存储器访问模式示例储存图 5-4. 1.2 力为能算更高的设备的全局存储器访问示图 5-6. ... 体冲突的共享存储器访问模式示例储存图 5-7. ......... 体冲突的共享存储器访问模式示例储存图 6-1. 阵乘 vi CUDA 编 2.0 南 , 版本指程
核 (manycore) 众程指南 , 版图所已 (language (runtime 第 1 章简介 1.1 CUDA: 可伸缩并行编程模型 CUDA 是 CUDA 的和 GPU 的种并行编程模型和软件环境 , 用于应对这种挑战。而对于熟绝一语图定律 , 其并行性还会不断扩展。这给我们带来了严峻的挑战 —— 我们需要开发出可透明地扩展并行语言等标准编程语言的尔 (barrier synchronization), CPU 核多出现意味着主流处理器芯片已进入并行时代。此外 , 根据摩物理处理器数量。时通过在任何可用处理器内核上处理各子问题来支持透明的可伸缩性 : 因而 , 编译 3D 应用软件 , 以利用日益增加处理器内核数量 , 这种情况正如行性以支持配备各种数量的内核的众的性核 GPU。形应用程序透明地扩展其并 C 核心有三个重要抽象概念 : 组层次结构、共享存储器、栅障同步悉些抽象提供了细粒度的数据并行和线程并行 , 嵌套于粗粒度的数据并行和任务并行之中。它们将指导程序员将问题为可独立处理的粗粒度子问题 , 再细分成细粒度的片段 , 以便通过协作的方法并行解决。这样的分解以允许线程在解决子问题时协作为目的设计了编程语言的表达方式 expressivity), 同这 system) 需程 1.2 GPU: 高度并行化的多线程、众核处理器 CUDA 员来说 , 迅速掌握序程难事。非 C 程序员来说 , 它们只是于对的一个极小扩展。言形永无尽头的需求 , 可编发展成为一种高度并行化的 CUDA 的后序可以在任何数量的处理器内核上执行 , 只有运行时系统要了解多线程、众核处理器 , 具有杰出的计算能力和极高的存储器带宽 , 如。示 CUDA 编 1 3D 足消费者对实时、高清晰度的满为程 GPU 图 1-1 本 2.0
Page 1 and 2: 程指南 , 版 NVIDIA CUDA 计
Page 3 and 4: 目录 1 2 3 第第 4 iii .......
Page 5: 程指南 , 版 5.3 5.4 5.5 6.1
Page 9 and 10: 渲程指南 , 版的第列
Page 11 and 12: 程指南 , 版变 (shared (intr
Page 13 and 14: 所 ,CUDA (host) 假 memory)。因
Page 15 and 16: 提 (compute 由 capability) 。
Page 17 and 18: 所块位 (constant (texture (tex
Page 19 and 20: 编的 ,C 标限 (host) (function
Page 21 and 22: 节变和助变 (implied (segme
Page 23 and 24: 工代语 ,__device__ 函对块
Page 25 and 26: 、2 分位是的节 (texture (
Page 27 and 28: 列数 (atomic ,atomicAdd() 将
Page 29 and 30: Direct3D 互。节和函节 ,D
Page 31 and 32: 的分个、cudaMallocPitch()
Page 33 and 34: 定类 ,cudaFilterModeLinear 是
Page 35 and 36: mode) emulation 是用 (printf() :
Page 37 and 38: 节函。cuCtxPopCurrent() 上 (u
Page 39 and 40: 。hostPtr copyParam.srcDevice = de
Page 41 and 42: 创填程指南 , 版上上
Page 43 and 44: 块器延迟。的 (if、switc
Page 45 and 46: warp , 当半块中的线程
Page 47 and 48: 存未为计程指南 , 版
Page 49 and 50: 字字存存 ,type 计 (Common
Page 51 and 52: 块和展个的位 ,warp 块
Page 53 and 54: 位的线性寻址。字程
Page 55 and 56: 的。个使用广播机制
Page 57 and 58:
节位数之节节或 (locali
Page 59 and 60:
相所选 ,Csub 等更高的
Page 61 and 62:
,Muld() 将的将相的程指
Page 63 and 64:
的节节节附录 A 技术
Page 65 and 66:
(round-towards-zero), : (denormaliz
Page 67 and 68:
程指南 , 版内间外距
Page 69 and 70:
后后后后程指南 , 版
Page 71 and 72:
和映位位程指南 , 版
Page 73 and 74:
位程指南 , 版处位计
Page 75 and 76:
≤ 寻的 × 是 × 是节个
Page 77 and 78:
程指南 , 版使用线性
show all

NVIDIA CUDA è®¡ç®ç»ä¸è®¾å¤æ¶æ

Create successful ePaper yourself

Delete template?

Save as template?

NVIDIA CUDA è®¡ç®ç»ä¸è®¾å¤æ¶æ