nvidia cuda开发环境配置全程指南

nvidia cuda开发环境配置全程指南

ID:1969967

大小:40.00 KB

页数:6页

时间:2017-11-14

nvidia cuda开发环境配置全程指南_第1页
nvidia cuda开发环境配置全程指南_第2页
nvidia cuda开发环境配置全程指南_第3页
nvidia cuda开发环境配置全程指南_第4页
nvidia cuda开发环境配置全程指南_第5页
资源描述:

《nvidia cuda开发环境配置全程指南》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、本文将引导您完成以下工作:1.开发环境必须软件的下载和安装2.建立CUDA工程,编译第一个程序3.运行样例程序4.测试设备兼容性5.设置CUDA源文件的语法高亮和智能感知6.编写第一个自己的程序:A+B CUDA软件包可以从NVIDIA官方网站上下载,我选择的是当前的最新版本3.2.需要下载的东西有3个,分别是:1.开发驱动(cudatoolkit_3.2.7_win_32.msi)2.工具包(devdriver_3.2_winvista-win7_32_260.61_notebook.exe)3.SDK样例代码(gpucomputin

2、gsdk_3.2_win_32.exe)   需要注意的问题是,这三个工具的版本号一定要匹配、还有就是要跟自己的操作系统和硬件匹配。比如笔记本电脑应选择带有notebook字样的下载,64位系统的要选择64位版本。   下载完成后进行安装,过程比较简单,一路下一步即可。安装完驱动后需要重启电脑。    IDE我选择的是VisualStudio2008TeamSystemSP1,据说2005和2003都可以用。需要注意的是一定要安装WindowsSDK,我的貌似是随着VS2008安装时自动安装的,但实验室的电脑就不是这样,具体表现为找不到

3、windows.h头文件和kernel32.lib库文件。我估计这个是个别现象,这里不再详谈。    安装完这些软件后,我们可以开始创建一个CUDA的程序了。网上有很多手动配置工程的方法,非常繁琐。我们基本上都会推荐使用更加自动化的工具:CUDAVSWizard,这个安装后会在VS中显示CUDA的项目模板。免去了繁琐的手工配置。   这个工具的项目主页是:http://sourceforge.net/projects/cudavswizard/   建议大家选择新版本,我选的是2.1    安装好Wizard,剩下的工作就比较简单了。在

4、VS中建立一个CUDA工程,先不要选择EmptyProject,建好后直接编译。顺利的话应该可以编译通过。运行时会提示找不到cutil32D.dll。如果你看到了找不到cutil32D.dll的错误,说明你之前的操作都是正确的。   如何正确运行程序呢?你需要将SDK安装目录下的Cbinwin32中Debug和Release两个文件夹加入系统Path环境变量中。什么,你不记得SDK装在哪儿了?不要紧,按Win+R组合键调出运行框,输入%NVSDKCOMPUTE_ROOT%,按回车,就会打开SDK的安装目录了~我的SDK装在C:

5、GPUSDK目录,我在Path中加的就是下面的两个目录C:GPUSDKCbinwin32ReleaseC:GPUSDKCbinwin32Debug    加完环境变量需要注销一遍系统才能生效。注销完重新打开VS2008,重新运行,应该可以看到命令行的输出了。    下面我们来测试一下设备信息,编译运行%NVSDKCOMPUTE_ROOT%CsrcdeviceQuery中的工程应该就可以看到了设备的信息了,我的输出是这样的:CUDADeviceQuery(RuntimeAPI)version(CUDARTstat

6、iclinking) Thereis1devicesupportingCUDA Device0:"GeForce9400M"CUDADriverVersion:3.20CUDARuntimeVersion:3.20CUDACapabilityMajor/Minorversionnumber:1.1Totalamountofglobalmemory:253296640bytesMultiprocessorsxCores/MP=Cores:2(MP)x8(Cores/MP)=16(Cores)Totalamountofconstantmem

7、ory:65536bytesTotalamountofsharedmemoryperblock:16384bytesTotalnumberofregistersavailableperblock:8192Warpsize:32Maximumnumberofthreadsperblock:512Maximumsizesofeachdimensionofablock:512x512x64Maximumsizesofeachdimensionofagrid:65535x65535x1Maximummemorypitch:2147483647b

8、ytesTexturealignment:256bytesClockrate:0.80GHzConcurrentcopyandexecution:NoRuntimelimitonkernels:YesInt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。