欢迎来到天天文库
浏览记录
ID:39455725
大小:1.77 MB
页数:80页
时间:2019-07-03
《基于GPU的并行程序设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、教师:张荣华华北电力大学计算机系软件教研室(保定)2021年7月23日星期五第七章并行程序设计范型第二部分基于GPU的并行程序设计第七章第二部分基于GPU的并行程序设计-3-引言参考资料n1.Nvidia,CUDAProgrammngGuide(CUDA2.0)nhttp://www.nvidia.com/object/cuda_develop.htmln2.M.Pharr(ed.),GPUGems2(ProgrammingTechniquesforHighPerformanceGraphicsa
2、ndGeneral-PurposeComputation),AddisonWesley,2005.nhttp://http.developer.nvidia.com/GPUGems2/gpugems2_part01.html(英文电子在线阅读)第七章第二部分基于GPU的并行程序设计-4-引言参考资料n3.GPU高性能运算之CUDAn张舒,褚艳利n中国水利水电出版社n2009年10月第七章第二部分基于GPU的并行程序设计-5-内容n1.引言n1.1GPU体系结构的演变n1.2GPU编程模型的演变n2
3、.CUDA编程模型n3.CUDA并行编程示例第七章第二部分基于GPU的并行程序设计-6-1.1GPU体系结构的演变n(1)传统的GPU结构及图形绘制流水线nfixed-functionGPU(功能固定的GPU)片元像素顶点处理光栅化处理操作(VP)(Rasterization)FPPOMemoryBufferV-Vertex(顶点)F-Fragment(片元)P-Pixel(像素)第七章第二部分基于GPU的并行程序设计-7-1.1GPU体系结构的演变n(1)传统的GPU结构及图形绘制流水线nfix
4、ed-functionGPU(功能固定的GPU)①③⑤②④第七章第二部分基于GPU的并行程序设计-8-1.1GPU体系结构的演变n(1)传统的GPU结构及图形绘制流水线nfixed-functionGPU(功能固定的GPU)n特点:n已经采用并行处理结构n任务并行n数据并行n采用功能固定的设计方式第七章第二部分基于GPU的并行程序设计-9-1.1GPU体系结构的演变n(2)可编程的GPU结构及图形绘制流水线shader函数顶点顶点图元图元片元片元像素生成处理生成处理生成处理操作VGVPPGPPFG
5、FPPO顶顶全纹顶全纹全纹输点点局理点局理局理出描数缓拓缓缓图述据存扑存存像缓存MemoryBufferV-Vertex(顶点)P-Primitive(图元)F-Fragment(片元)P-Pixel(像素)可编程GPU结构图第七章第二部分基于GPU的并行程序设计-11-1.1GPU体系结构的演变n(3)UnifiedShaderGPU(统一渲染架构)n主要目的是再提升可编程GPU的效率。n概念的由来:n由于图形的处理流程采用流水线的方式,必须要等到上一个阶段处理完成才能进行下一个阶段的工作。n这
6、容易导致性能问题。G80是首个支持DirectX10,使用“统一渲染架构”的显示核心第七章第二部分基于GPU的并行程序设计-12-1.1GPU体系结构的演变n2007年,G80并行计算平台(G80图形模式)HostInputAssemblerSetup/Rstr/ZCullVtxThreadIssueGeomThreadIssuePixelThreadIssueSPSPSPSPSPSPSPSPSPSPSPSPSPSPSPSPTFTFTFTFTFTFTFTFTL1L1L1L1L1L1L1L1hrea
7、dProcesL2L2L2L2L2L2sorFBFBFBFBFBFB第七章第二部分基于GPU的并行程序设计-13-1.1GPU体系结构的演变闲置的shadercapacity使用的shadercapacity第七章第二部分基于GPU的并行程序设计-14-1.1GPU体系结构的演变UnifiedShader第七章第二部分基于GPU的并行程序设计-15-1.1GPU体系结构的演变nUnifiedShaderGPU的图形绘制流水线第七章第二部分基于GPU的并行程序设计-16-1.1GPU体系结构的演变n
8、GPU现状n高度并行化、多线程、高存储器带宽、众核、可编程G80GeForce8800GTXG92GeForce9800GTXGT200GeForceGTX280CPU与GPU的峰值浮点计算能力比较第七章第二部分基于GPU的并行程序设计-17-1.1GPU体系结构的演变nGPU与CPUGPU(GraphicsProcessUnit)通用CPUn面向计算密集型和大量数据并n面向通用计算行化的计算n大量的晶体管用于Cache和控制n大量的晶体管用于数据处理电路ALUALUControl
此文档下载收益归作者所有