cuda 的经典入门

cuda 的经典入门

ID:26060908

大小:1.84 MB

页数:77页

时间:2018-11-24

cuda 的经典入门_第1页
cuda 的经典入门_第2页
cuda 的经典入门_第3页
cuda 的经典入门_第4页
cuda 的经典入门_第5页
资源描述:

《cuda 的经典入门》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、NVIDIACUDA计算统一设备架构编程指南版本2.06/7/2008CUDA编程指南,版本2.071CUDA编程指南,版本2.071目录第1章简介11.1CUDA:可伸缩并行编程模型11.2GPU:高度并行化、多线程、多核处理器11.3文档结构3第2章编程模型42.1线程层次结构42.2存储器层次结构62.3主机和设备62.4软件栈72.5计算能力8第3章GPU实现93.1具有芯片共享存储器的一组SIMT多处理器93.2多个设备113.3模式切换11第4章应用程序编程接口124.1C编程语言的扩展124.2语言扩展124.2.1函数类型限定符124.2.1.1_device_12

2、4.2.1.2_global_134.2.1.3_host_134.2.1.4限制134.2.2变量类型限定符134.2.2.1_device_134.2.2.2_constant_134.2.2.3_shared_144.2.2.4限制144.2.3执行配置154.2.4内置变量154.2.4.1gridDim154.2.4.2blockIdx154.2.4.3blockDim154.2.4.4threadIdx154.2.4.5warpSize164.2.4.6限制164.2.5使用NVCC进行编译164.2.5.1_noinline_164.2.5.2#pragmaunrol

3、l164.3通用运行时组件174.3.1内置向量类型174.3.1.1char1、uchar1、char2、uchar2、char3、uchar3、char4、uchar4、short1、ushort1、short2、ushort2、short3、ushort3、short4、ushort4、int1、uint1、int2、uint2、int3、uint3、int4、uint4、long1、ulong1、long2、ulong2、long3、ulong3、long4、ulong4、float1、float2、float3、float4、double2174.3.1.2dim3类型1

4、74.3.2数学函数174.3.3计时函数174.3.4纹理类型184.3.4.1纹理参考声明184.3.4.2运行时纹理参考属性18CUDA编程指南,版本2.0714.3.4.3来自线性存储器的纹理与来自CUDA数组的纹理194.4设备运行时组件194.4.1数学函数194.4.2同步函数194.4.3纹理函数194.4.3.1来自线性存储器的纹理194.4.3.2来自CUDA数组的纹理204.4.4原子函数204.4.5warpvote函数204.5主机运行时组件214.5.1一般概念214.5.1.1设备214.5.1.2存储器224.5.1.3OpenGL互操作性224.5

5、.1.4Direct3D互操作性224.5.1.5异步并发执行224.5.2运行时API234.5.2.1初始化234.5.2.2设备管理234.5.2.3存储器管理244.5.2.4流管理254.5.2.5事件管理254.5.2.6纹理参考管理254.5.2.7OpenGL互操作性274.5.2.8Direct3D互操作性274.5.2.9使用设备模拟模式进行调试284.5.3驱动程序API294.5.3.1初始化294.5.3.2设备管理294.5.3.3上下文管理294.5.3.4模块管理304.5.3.5执行控制304.5.3.6存储器管理314.5.3.7流管理324.5

6、.3.8事件管理324.5.3.9纹理参考管理334.5.3.10OpenGL互操作性334.5.3.11Direct3D互操作性33第5章性能指南355.1指令性能355.1.1指令吞吐量355.1.1.1数学指令355.1.1.2控制流指令365.1.1.3存储器指令365.1.1.4同步指令375.1.2存储器带宽375.1.2.1全局存储器375.1.2.2本地存储器435.1.2.3固定存储器435.1.2.4纹理存储器435.1.2.5共享存储器435.1.2.6寄存器485.2每个块的线程数量49CUDA编程指南,版本2.0715.3主机和设备间的数据传输495.4纹

7、理获取与全局或固定存储器读取的对比505.5整体性能优化战略50第6章矩阵乘法示例526.1概述526.2源代码清单536.3源代码说明546.3.1Mul()546.3.2Muld()54附录A技术规范56A.1一般规范56A.1.1计算能力1.0的规范56A.1.2计算能力1.1的规范57A.1.3计算能力1.2的规范57A.1.4计算能力1.3的规范57A.2浮点标准57附录B标准数学函数59B.1一般运行时组件59B.1.1单精度浮点函数59B.1.2双精度浮

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。