面向通用计算GPU集群的任务自动分配系统-论文.pdf

面向通用计算GPU集群的任务自动分配系统-论文.pdf

ID:58306832

大小:1.55 MB

页数:6页

时间:2020-05-20

面向通用计算GPU集群的任务自动分配系统-论文.pdf_第1页
面向通用计算GPU集群的任务自动分配系统-论文.pdf_第2页
面向通用计算GPU集群的任务自动分配系统-论文.pdf_第3页
面向通用计算GPU集群的任务自动分配系统-论文.pdf_第4页
面向通用计算GPU集群的任务自动分配系统-论文.pdf_第5页
资源描述:

《面向通用计算GPU集群的任务自动分配系统-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第3期计算机工程2014年3月Vl01.40NO.3ComputerEngineeringMarch20l4·体系结构与软件技术·文章编号;1000-3428(2014)03—0103-05文献标识码:A中田分类号:N945面向通用计算GPU集群的任务自动分配系统胡新明,盛冲冲,李佳佳,吴百锋(复旦大学计算机科学技术学院,上海201023)摘要:当前GPU集群的主流编程模型是MPI与CUDA的松散耦合,采用这种编程模型进行编程,存在编程复杂度大、程序的可移植性差、执行效率低等问题。为此,提出一种面向通用计算G

2、PU集群的任务自动分配系统StreamMAP。对编译器进行改造,以编译制导的方式提供集群任务的计算资源需求,通过运行时系统动态地发现、建立并维护系统资源拓扑,设计一种较为契合GPU集群应用特征的任务分配策略。实验结果表明,StreamMAP系统能降低集群应用程序的编程复杂度,使之较为高效地利用GPU集群的计算资源,且程序的可移植性和可扩展性也得到了保证。关健词:GPU集群;异构;编程模型;任务分配;可移植陛;可扩展性AutomaticTaskAssignmentSystem0fGeneralComputingOrie

3、ntedGPUClusterHUXin-ming,SHENGChong-chong,LIJia-jia,wUBai—feng(SchoolofComputerScience,FudanUniversity,Shanghai201203,China)[Abstract]MPI+CUDAarethemainstreamprogrammingmodelsofcurrentGPUclusterarchitecture.However,byusingsuchalowlevelprogrammingmodel,programme

4、rsrequiredetailedknowledgeoftheunderlyingarchitecture,whichexertsaheavyburden.Besides,theprogramislessportabilityandineficient.ThispaperproposesStreamMAEanautomatictaskassignmentsystemonGPUclusters.Itprovidespower~l,yetconciselanguageextensionsuitabletodescribe

5、thecomputeresourcedemandsofclustertasks.Itdevelopsaruntimesystemtomaintainresourceinformation,andsuppliesanautomatictaskassignmentforGPUcluster.ExperimentsshowthatStreamMAPprovidesprogrammability,portabilityandscalabilityforGPUclusterapplication.[KeywordslGPUcl

6、uster;heterogeneous;programmingmodel;taskassignment;portability;scalabilityDOI:1O.3969/j.issn.1000-3428.2014.03.021并行计算能力呈现多层次化。GPU集群不仅能够支持常规1概述粒度的单程序多数据(SingleProgramMultipleDate,SPMD)采用具有大规模并行计算能力的GPU作为异构加速设和多程序多数据(MultipleProgramMultipleDate,MPMD)计备的GPU集群在科学

7、计算领域得到了广泛的研究和应用。算能力,而且可以支持更细粒度的面向大规模数据的SPMD文献[1]采用GPU集群作为底层运行平台来加速流计算应和单指令多数据(SingleInstructionMultipleData,SIMD)计用。文献[2】将分子生物学中蛋白质分子场的计算程序并行算能力。GPU集群这种异构计算资源和多层次并行计算能化,使之能够在GPU集群上加速执行。此外,GPU集群在力给并行程序设计带来了巨大的困难。仿真学和分子动力学等领域也有大量应用实现。研究结为了更好地对GPU集群这种异构计算平台进行编果表明,

8、对于具有数据密集型计算的应用,相比较于传统程,学术界在编程模型方面进行了大量的研究。文献[6]和的计算平台,GPU集群能够提供充分的计算能力,并带来文献[7]对基于SMP体系结构的并行编程模型MPI+openMP可观的性能加速比。进行了初步的探索。文献[8】对现有的消息传递系统进行了GPU的加入使得GPU集群呈现节点内部资源的异构扩充,以使其能

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。