面向通用计算的GPU集群设计.pdf

面向通用计算的GPU集群设计.pdf

ID:51971219

大小:17.04 MB

页数:60页

时间:2020-03-20

面向通用计算的GPU集群设计.pdf_第1页
面向通用计算的GPU集群设计.pdf_第2页
面向通用计算的GPU集群设计.pdf_第3页
面向通用计算的GPU集群设计.pdf_第4页
面向通用计算的GPU集群设计.pdf_第5页
资源描述:

《面向通用计算的GPU集群设计.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、面向通用计算的GPU集群设计TheDesignofGPUClusterorientedtoGeneralpurposeComputing霍洪鹏导师:吴百锋教授指导小组成员:彭澄廉教授孙晓光副教授陈泽文高级工程师目录目录@录ϊI觀ϊIllAbstractϊIVm-M绺论ϊe1.1研究背景ϊ61.2研究现状ϊ71.3研究内容ϊ91.4本文创新点ϊ101.5全文组织与安排ϊ10第二章GPL!集群体系结构ϊ112.1传统集群体系结构ϊ112.2异构计算资源GPUϊ142.2.1ϊGPU的发展ϊ142.2.2ϊGPU的特点ϊ172.3ϊGPU集群体系结构ϊ182.4ϊGPU集群部

2、署ϊ20第三章GPU集群编程模型ϊ233.1集群编程模型与范例ϊ233.1.1任务播种ϊ233.1.2单控制流多数据流ϊ243.1.3数据流水线ϊ253.1.4分治策略ϊ263.2传统集群编程模型ϊ273.2.2消息传递接口ϊ273.1.3ϊOpenMPϊ283.2GPU编程模型ϊ283.2.1ϊCUDAϊ283.2.2ϊOpenCLϊ29I目录3.2.3OpenACCϊ303.3Stream编程模型ϊ313.3.1设计原则ϊ323.3.2设计S标ϊ343.3.3适用范围ϊ353.3.4系统模型ϊ353.3.5语法规则ϊ373.3.5通信原语ϊ393.3.6模型实现ϊ4

3、0第四章GPU集群能量有效性ϊ444.1资源,任务和能耗模型ϊ444.1.1计算资源ϊ444.1.2任务模型ϊ454.1.3能量评估模型ϊ464.2调度目标ϊ474.3调度方案ϊ484.3.1调度参数ϊ484.3.2任务划分ϊ494.3.3调度算法ϊ494.4方案分析ϊ51第六章总结与展望ϊ53詩讀ϊ55读硕士期间公开发表的论文ϊ57龍ϊ58摘要摘要由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU己经成为超级计算机和高性能计算(HighPerformanceComputing,HPC)集群的主流加速器。越来越多的应用程序通过基于GPU数据并行

4、地重新设计达到可观的加速比。因此,在HPC领域,GRJ集群己经成为新的重要的研究热点,并且传统集群也正演化成为GPU加强的集群或GPU集群。本文从体系结构出发,通过对传统集群以及GPU特点的分析,总结了GPU集群体系结构特点,并指明了GPU集群中独特的异构计算特点以及强大的多层次并行计算能力。在理论研宄的指导下,通过对现有计算资源的整合构建了一个节点异构GPU集群系统,并阐述了详细的GPU集群搭建步骤。主流GPU集群编程模型大多采用消息传递机制以及异构计算简单结合的方式,这种方式往往是低效而且易错的。这种模型对应用程序的描述和设计的不足根源在于其没有从编程和计算模型层面

5、同时契合GPU众核体系结构和集群环境。Stream编程模型深入分析并行计算模式从编程模型顶层出发提供显式多层面的并行设计机制,引导程序员将程序设计的视角从简单的功能和进程划分到数据有关的计算划分,使其能够充分契合GPU集群强大的数据并行计算能力。随着处理单元的发展和集群节点的拓展,GPU集群将在节点层面趋于异构化。本文提出了一套针对异构任务在节点异构GPU集群上的能量有效调度方案。我们形式化地描述了其任务和资源模型以及能耗评估模型。通过特定的节点选择策略,减少空闲状态的能耗损失。通过任务类型划分和组合分配以及DVFS,增加CPU资源利用率。本方案从系统层面着手,能够与现

6、有的算法和指令层面的优化方法兼容。本文从体系结构、编程模型、能耗有效性角度,对GPU集群系统进行了深入研究,提出了一整套面向GPU集群的设计方案,并且指导完成了GPU集群软硬件环境的构建,实现并部署了适合GPU集群大规模数据级并行能力的流处理并行编程环境。最后对节点异构GPU集群能耗有效性研究,从系统层面提出了一套能耗有效性任务调度方案。本文对面向通用计算的GPU集群系统的设计具有系统指导意义。关键词:GPU集群并行计算编程模型能耗中图分类号:TP391AbstractAbstractBecauseofpowerfulcomputingpower,high-speedm

7、emoryaccessbandwidthandsupportinglarge-scaledata-levelparallelism,theGPUshavebecomethemainstreamacceleratorsinsupercomputersandhighperformancecomputingfield.MoreandmoreapplicationsachievesubstantialspeedupviaGPU-baseddata-levelparallelismre-designre.Therefore,intheHPCfiel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。