欢迎来到天天文库
浏览记录
ID:26060908
大小:1.84 MB
页数:77页
时间:2018-11-24
《cuda 的经典入门》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、NVIDIACUDA计算统一设备架构编程指南版本2.06/7/2008CUDA编程指南,版本2.071CUDA编程指南,版本2.071目录第1章简介11.1CUDA:可伸缩并行编程模型11.2GPU:高度并行化、多线程、多核处理器11.3文档结构3第2章编程模型42.1线程层次结构42.2存储器层次结构62.3主机和设备62.4软件栈72.5计算能力8第3章GPU实现93.1具有芯片共享存储器的一组SIMT多处理器93.2多个设备113.3模式切换11第4章应用程序编程接口124.1C编程语言的扩展124.2语言扩展124.2.1函数类型限定符124.2.1.1_device_12
2、4.2.1.2_global_134.2.1.3_host_134.2.1.4限制134.2.2变量类型限定符134.2.2.1_device_134.2.2.2_constant_134.2.2.3_shared_144.2.2.4限制144.2.3执行配置154.2.4内置变量154.2.4.1gridDim154.2.4.2blockIdx154.2.4.3blockDim154.2.4.4threadIdx154.2.4.5warpSize164.2.4.6限制164.2.5使用NVCC进行编译164.2.5.1_noinline_164.2.5.2#pragmaunrol
3、l164.3通用运行时组件174.3.1内置向量类型174.3.1.1char1、uchar1、char2、uchar2、char3、uchar3、char4、uchar4、short1、ushort1、short2、ushort2、short3、ushort3、short4、ushort4、int1、uint1、int2、uint2、int3、uint3、int4、uint4、long1、ulong1、long2、ulong2、long3、ulong3、long4、ulong4、float1、float2、float3、float4、double2174.3.1.2dim3类型1
4、74.3.2数学函数174.3.3计时函数174.3.4纹理类型184.3.4.1纹理参考声明184.3.4.2运行时纹理参考属性18CUDA编程指南,版本2.0714.3.4.3来自线性存储器的纹理与来自CUDA数组的纹理194.4设备运行时组件194.4.1数学函数194.4.2同步函数194.4.3纹理函数194.4.3.1来自线性存储器的纹理194.4.3.2来自CUDA数组的纹理204.4.4原子函数204.4.5warpvote函数204.5主机运行时组件214.5.1一般概念214.5.1.1设备214.5.1.2存储器224.5.1.3OpenGL互操作性224.5
5、.1.4Direct3D互操作性224.5.1.5异步并发执行224.5.2运行时API234.5.2.1初始化234.5.2.2设备管理234.5.2.3存储器管理244.5.2.4流管理254.5.2.5事件管理254.5.2.6纹理参考管理254.5.2.7OpenGL互操作性274.5.2.8Direct3D互操作性274.5.2.9使用设备模拟模式进行调试284.5.3驱动程序API294.5.3.1初始化294.5.3.2设备管理294.5.3.3上下文管理294.5.3.4模块管理304.5.3.5执行控制304.5.3.6存储器管理314.5.3.7流管理324.5
6、.3.8事件管理324.5.3.9纹理参考管理334.5.3.10OpenGL互操作性334.5.3.11Direct3D互操作性33第5章性能指南355.1指令性能355.1.1指令吞吐量355.1.1.1数学指令355.1.1.2控制流指令365.1.1.3存储器指令365.1.1.4同步指令375.1.2存储器带宽375.1.2.1全局存储器375.1.2.2本地存储器435.1.2.3固定存储器435.1.2.4纹理存储器435.1.2.5共享存储器435.1.2.6寄存器485.2每个块的线程数量49CUDA编程指南,版本2.0715.3主机和设备间的数据传输495.4纹
7、理获取与全局或固定存储器读取的对比505.5整体性能优化战略50第6章矩阵乘法示例526.1概述526.2源代码清单536.3源代码说明546.3.1Mul()546.3.2Muld()54附录A技术规范56A.1一般规范56A.1.1计算能力1.0的规范56A.1.2计算能力1.1的规范57A.1.3计算能力1.2的规范57A.1.4计算能力1.3的规范57A.2浮点标准57附录B标准数学函数59B.1一般运行时组件59B.1.1单精度浮点函数59B.1.2双精度浮
此文档下载收益归作者所有