基于openacc的自动并行化技术研究

基于openacc的自动并行化技术研究

ID:35178996

大小:5.18 MB

页数:67页

时间:2019-03-20

基于openacc的自动并行化技术研究_第1页
基于openacc的自动并行化技术研究_第2页
基于openacc的自动并行化技术研究_第3页
基于openacc的自动并行化技术研究_第4页
基于openacc的自动并行化技术研究_第5页
资源描述:

《基于openacc的自动并行化技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于OpenACC的自动并行化技术研究ResearchonOpenACC-BasedAutomaticParallelizationTechnology作者:蔡达导师:夏阳教授中国矿业大学二○一六年五月中图分类号TP314学校代码10290UDC密级公开中国矿业大学硕士学位论文基于OpenACC的自动并行化技术研究ResearchonOpenACC-BasedAutomaticParallelizationTechnology作者蔡达导师夏阳申请学位工学硕士培养单位计算机科学与技术学院学科专业计算机应用技术研究方向并行计算答辩委员会主席评阅人二○一六年五月论文审阅认定书

2、研究生蔡达在规定的学习年限内,按照研究生培养方案的要求,完成了研究生课程的学习,成绩合格;在我的指导下完成本学位论文,经审阅,论文中的观点、数据、表述和结构为我所认同,论文撰写格式符合学校的相关规定,同意将本论文作为学位申请论文送专家评审。导师签字:年月日致谢本论文是在夏阳教授的悉心指导下完成的,没有夏老师的指导、鼓励及科研资金上的大力支持,论文是不可能得以顺利完成的。师从三载,收获颇丰,感触亦深。夏老师优秀的做人品质,严谨的治学态度,开拓创新的精神,高屋建瓴把握全局的能力,忘我的工作精神给学生树立起潜移默化的典范作用,这也是夏老师传授给我的最宝贵的财富。在此,谨向我的导师夏阳教授

3、致以最崇高的敬意和最衷心的感谢。感谢已经毕业的王凯、孙研博师兄,感谢江慧芳、叶枫、朱云超、申超祥同学,谢谢你们在这三年的学习和生活中给予我的关心和帮助,带给我很多难以忘怀的美好记忆和快乐时光,能同你们一起作为夏老师的学生,在同一个实验室工作和学习,深感荣幸!感谢计算机学院硕士13级所有的同学,特别是班长,在这三年中给予我的关心和帮助。感谢父母一直以来对我无微不至的关怀、信任、鼓励和支持。你们是我最强大的后盾,给我前进的勇气和力量。在此,我向我的家人致以最诚挚的谢意!最后,向所有曾经帮助过我的老师、同学和朋友们表示深深的感谢!摘要计算需求日益增多的今天,人们普遍采用GPU(Graph

4、icsProcessingUnit)作为运算加速设备,现在利用通用显示核心(General-PurposeGPU,GPGPU)计算技术已经成为任何海量数据的必要手段。但复杂的硬件环境、与CPU不同的编程模型,拉高了GPU运算的门槛。为了使更多的科研工作者用到GPU的运算,显卡厂商和编译器公司制订并推广了OpenACC标准。本文在OpenACC的基础上,提出一个自动为串行代码优化加速运算的框架——GENerateOpenACC,GENACC。该框架通过对源代码的静态程序分析,实现热点代码段的识别、运算特征分析,最终为源代码加上OpenACC指导命令,达到加速串行代码运算的目的。对于G

5、ENACC框架中热点代码分析阶段的运算时间估计和硬件加速能力判别问题,本文构建了一个新的运算代价评估模型。该模型通过热点代码的分析,以及对计算平台硬件属性的分层建模,实现了对运算所需的时间、完成运算过程消耗的能量的建模,是评价运算代价、合理选择运算设备的重要依据。对运算代价中的运算时间部分,结合并行计算的LogGP模型和运算理论峰值的Roofline模型,提出一个新的计算时间估计模型。本文依照建模的粒度粗细通过三层建模来计算消耗的能量。最后,本文通过EPCC测试集与NPB测试集,对运算代价评估模型和GENACC框架进行实验,实验结果表明GENACC能够正确生成编译器指导指令,生成的

6、源码在不同数据大小上均有较好性能。该论文有图19幅,表8个,参考文献58篇。关键词:显示核心通用计算;自动并行化;代价模型;LogGP模型;Roofline模型;OpenACC指导命令IAbstractInrecentyears,GPUiswidelyusedasanacceleratedcomputingdevice.Besides,thecomputingtechnologywithGeneral-PurposeGPUwhichabbreviatedasGPGPUhasbecomeanecessarymeansofdealingwithanylargeamountsofdata

7、.However,thedifficultyofGPUcomputinghasbeenincreasedbycomplexhardwareenvironmentanddifferentCPUprogrammingmodels.ToenablemoreresearcherstouseGPUcomputing,thegraphicscardmanufacturersandcompilercompaniesdevelopandpromotetheOpenACCstandar

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。