面向cpu-gpu架构的源到源自动映射方法

面向cpu-gpu架构的源到源自动映射方法

ID:9084559

大小:3.06 MB

页数:7页

时间:2018-04-17

面向cpu-gpu架构的源到源自动映射方法_第1页
面向cpu-gpu架构的源到源自动映射方法_第2页
面向cpu-gpu架构的源到源自动映射方法_第3页
面向cpu-gpu架构的源到源自动映射方法_第4页
面向cpu-gpu架构的源到源自动映射方法_第5页
资源描述:

《面向cpu-gpu架构的源到源自动映射方法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、ComputerEngineeringandApplications计算机工程与应用2015,51(21)41面向CPU-GPU架构的源到源自动映射方法111121朱正东,刘袁,魏洪昌,颜康,王寅峰,董小社111121ZHUZhengdong,LIUYuan,WEIHongchang,YANKang,WANGYinfeng,DONGXiaoshe1.西安交通大学电子与信息工程学院,西安7100492.深圳信息职业技术学院,广东深圳5181721.SchoolofElectronic&InformationEngineering,Xi’anJiaotongUniversity,X

2、i’an710049,China2.ShenzhenInstituteofInformationTechnology,Shenzhen,Guangdong518172,ChinaZHUZhengdong,LIUYuan,WEIHongchang,etal.NovelautomaticmappingtechnologyonCPU-GPUheteroge-neoussystems.ComputerEngineeringandApplications,2015,51(21):41-47.Abstract:Aimingatthedevelopingandportingdifficult

3、iesofGPU-basedapplications,amappingapproachisproposed,whichconvertsserialcomputingsourcecodeintoequivalentparallelcomputingsourcecode.Thisapproachacquireshier-archiesofparallelizableloopsfromserialsources,establishesthecorrespondencebetweenloopstructuresandGPUthreads,andgeneratesthecorefunct

4、ioncodeforGPU.Meanwhile,CPUcontrolcodeisgeneratedaccordingtoread/writeattributesofvariablereferences.Acompilerprototypeisimplementedbasedonthisapproach,whichtranslatesCcodeintoCUDAcodeautomatically.FunctionalityandperformanceevaluationsoftheprototypeshowthattheCUDAcodegeneratedisfunctionally

5、equivalenttotheoriginalCcode,withsignificantimprovementinperformance,thusovercomesthediffi-cultyinportingcompute-intensiveapplicationstoCPU-GPUheterogeneoussystems.Keywords:GeneralPurposeGraphicProcessingUnit(GPGPU);ComputeUnifiedDeviceArchitecture(CUDA);auto-maticmapping;sourcetosourcecompi

6、le摘要:针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。关键词:通用计算图形处理器(GPGPU);统一计算架构(CUD

7、A);自动映射;源到源编译文献标志码:A中图分类号:TP303doi:10.3778/j.issn.1002-8331.1407-0523目前图形处理器(GraphicProcessingUnit,GPU)线程和多级存储结构依然使程序开发人员在CPU-GPU依靠其强大的计算能力已经被广泛应用于能源探测、金异构多核系统上进行编程和移植花费大量的时间和精[1]融分析、生物医学等各个领域,然而复杂的体系结构对力。目前,利用源到源编译技术帮助用户在GPU下进应用移植造成了较大的阻碍,统一计算架构(C

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。