基于gpu平台的svd并行计算研究与实现

基于gpu平台的svd并行计算研究与实现

ID:23483925

大小:4.18 MB

页数:118页

时间:2018-11-08

基于gpu平台的svd并行计算研究与实现_第1页
基于gpu平台的svd并行计算研究与实现_第2页
基于gpu平台的svd并行计算研究与实现_第3页
基于gpu平台的svd并行计算研究与实现_第4页
基于gpu平台的svd并行计算研究与实现_第5页
资源描述:

《基于gpu平台的svd并行计算研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA专业学位硕士学位论文MASTERTHESISFORPROFESSIONALDEGREE(电子科技大学图标)论文题目基于GPU平台的SVD并行计算研究与实现学科专业电子与通信工程学号201122010427作者姓名唐吉卓指导教师林水生教授分类号密级UDC注1学位论文基于GPU平台的SVD并行计算研究与实现(题名和副题名)唐吉卓(作者姓名)指导教师林水生教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士专业学位类别

2、工程硕士工程领域名称电子与通信工程提交论文日期2014.5.12论文答辩日期2014.5.22学位授予单位和日期电子科技大学2014年6月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。RESEARCHANDIMPLEMENTATION OFPARALLELCOMPUTINGOFSVDBASEDONGPUAMasterDissertationSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:ElectronicandCommunica

3、tionEngineeringAuthor:TangJizhuoAdvisor:Prof.LinShuiShengSchool:SchoolofCommunication&InformationEngineering独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢

4、意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日摘要摘要矩阵的奇异值分解作为一种重要的矩阵分解,在数学、物理学、医学、工学等学科和领域具有广泛的应用背景。矩阵奇异值分解数值计算的研究由来已久,其中,计算速度

5、和精度是该项研究的基本内容,近几十年来,由于并行计算系统的出现,奇异值分解的并行算法研究逐渐成为热点,但是,以往的研究主要针对任务级并行,这种并行算法对矩阵的划分粒度较粗,适用于多处理器计算系统。近年来以GPU为代表的众核处理器采用SIMD或SIMT体系结构,传统的并行SVD算法在这些平台上计算并不能发挥出较高的效率。因此,本文将基于GPU平台的SVD并行计算作为本文的主要研究方向。本文首先研究了基于QR方法的SVD算法。作为应用最为广泛的算法,针对该算法的研究较为广泛,但由于该算法串行度较高,数据依赖性较强,其并行算法的效率通

6、常不高。本文从运算速度和精度两方面分析了带Wilkinson位移的QR迭代算法、零位移QR迭代算法以及它们的混合选择算法的性能特点和差异,针对这些算法在上对角元素归零过程中的“向下越界”问题,在混合选择算法的基础上进行改进,设计了动态位移算法,对该算法进行的数值实验结果表明,该算法对矩阵收敛速度起到积极作用,相对传统算法的最高加速比在1.1以上;此外,本文设计了基于GPU平台的细粒度并行动态位移算法,并对其中的矩阵对角化更新提出了一种新的细粒度并行划分方法,该方法将算法中串行度较高的二对角矩阵更新部分在GPU高效并行执行,优化后

7、的算法运行时间能减少10%左右。基于Jacobi方法的SVD算法是另外一种重要的算法,它具有相对精度高等特点,该方法分为双边Jacobi算法和单边Jacobi算法,其中,单边Jacobi算法运算量小,且其结构易于并行计算,本文对并行单边Jacobi算法进行了深入研究。数据调度序列用来生成每次并行迭代参与运算的列对组合,对算法性能起到关键作用,本文通过数值实验分析了列范数波动对算法收敛速度的影响,并基于此结果,研究了并行单边Jacobi算法的各类静态序列和动态序列的性能特点,针对单独使用静态序列无用计算过多、动态序列附加运算量大等

8、问题,本文结合二者优势,给出了二者的混合序列算法,并结合列范数波动率给出了序列选择依据,数值实验结果表明,混合算法能够改善算法的收敛速度,运算速度相比传统算法能够提高10%以上。另外,本文设计了改进算法在GPU平台的细粒度并行算法,提出了静态序列更新在GPU实现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。