欢迎来到天天文库
浏览记录
ID:34712399
大小:4.59 MB
页数:68页
时间:2019-03-09
《基于cuda的并行pcg方法自动生成系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文论文题目:基于CUDA的并行PCG方法自动生成系统研究与实现作者姓名王宇指导教师高家全教授学科专业计算机技术培养类别全日制专业学位硕士所在学院计算机科学与技术学院提交日期2017年3月28日万方数据浙江工业大学硕士学位论文基于CUDA的并行PCG方法自动生成系统研究与实现作者姓名:王宇指导教师:高家全教授浙江工业大学计算机科学与技术学院2017年3月万方数据DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterTheAutomaticGenerati
2、onSystemoftheParallelPCGMethodBasedonCUDACandidate:YuWangAdvisor:Prof.JiaquanGaoCollegeofComputerScienceandTechnologyZhejiangUniversityofTechnologyMar.2017万方数据浙江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构
3、的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密□,在一年解密后适用本授权书。2、保密□,在二年解密后适用本授权书。3、保密□,在三年解密后适用本授权书。
4、4、不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月日万方数据浙江工业大学硕士学位论文基于CUDA的并行PCG方法自动生成系统研究与实现摘要预条件共轭梯度(PCG)算法作为求解稀疏线性方程组的主流方法之一,近年来随着问题规模的增大和GPU计算能力的快速提高,用于求解大规模问题的并行PCG算法引起了更广泛的关注。并行PCG算法的研究重点是针对该方法的主要成分研究实现高效的并行方法。如果通过人为方式寻找各个成分的最优实现,由于每个成分实现方式多样,而且影响其性能的参数取值范围广,显然需要极大的工作量。为此,本论文通过优化建
5、模技术,对PCG算法的主要成分分别构建并行优化性能模型,从现有的核函数中选择出最优的核函数和参数配置,达到快速生成高效并行PCG算法的目的。本论文的主要工作和贡献如下:1.提出矢量运算、矢量内积的并行优化性能模型。分别对矢量运算、矢量内积建立并行优化性能模型,通过决策树生成算法,自动生成决策树。实验证明,本论文的矢量运算、矢量内积决策树对核函数以及参数的选择非常有效。2.提出稀疏矩阵矢量乘(SpMV)的并行优化性能模型。以5种经典的存储格式为例,建立并行优化性能模型,并通过自动选择最优核函数算法,自动选择稀疏矩阵最佳的存储格式、最优的核函数以及参数配置
6、。实验证明,本论文的SpMV并行优化性能模型预测核函数的执行时间的精度达95%以上,自动选择核函数算法具有鲁棒性,可靠性强。3.提出PCG并行优化框架。该框架包含PCG算法各个成分的并行优化性能模型,各个模型相互独立,具有很强的可扩展性。4.设计并实现基于CUDA的并行PCG方法自动生成系统。该系统使用图形化界面为PCG算法的主要成分构建并行优化性能模型,自动生成高效的并行PCG方法。实验证明,自动生成系统是有效可行的,通过本系统自动生成的并行PCG方法在单个GPU上的平均加速比为56.91,在单节点2个GPU上的平均加速比可达到104.06。关键词:
7、并行PCG方法,性能模型,自动生成系统,CUDA,GPUi万方数据浙江工业大学硕士学位论文TheAutomaticGenerationSystemoftheParallelPCGMethodBasedonCUDAABSTRACTThepreconditionedconjugategradient(PCG)algorithmisoneofthepopularmethodsforsolvinglargesparselinearsystems.Inrecentyears,acceleratingthePCGalgorithmonGPUhasattracted
8、considerableattention.However,onaspecificmulti-
此文档下载收益归作者所有