使用gpu加速计算矩阵的cholesky分解-计算机应用与软件

使用gpu加速计算矩阵的cholesky分解-计算机应用与软件

ID:32359974

大小:1.15 MB

页数:5页

时间:2019-02-03

使用gpu加速计算矩阵的cholesky分解-计算机应用与软件_第1页
使用gpu加速计算矩阵的cholesky分解-计算机应用与软件_第2页
使用gpu加速计算矩阵的cholesky分解-计算机应用与软件_第3页
使用gpu加速计算矩阵的cholesky分解-计算机应用与软件_第4页
使用gpu加速计算矩阵的cholesky分解-计算机应用与软件_第5页
资源描述:

《使用gpu加速计算矩阵的cholesky分解-计算机应用与软件》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第33卷第9期计算机应用与软件Vol33No.92016年9月ComputerApplicationsandSoftwareSep.2016使用GPU加速计算矩阵的Cholesky分解沈聪高火涛(武汉大学电子信息学院湖北武汉430072)摘要针对大型实对称正定矩阵的Cholesky分解问题,给出其在图形处理器(GPU)上的具体实现。详细分析了Volkov计算Cholesky分解的混合并行算法,并在此基础上依据自身计算机的CPU以及GPU的计算性能,给出一种更为合理的三阶段混合调度方案,进一步减少CPU的空闲时间以及

2、避免GPU空闲情况的出现。数值实验表明,当矩阵阶数超过7000时,新的混合调度算法相比标准的MKL算法获得了超过5倍的加速比,同时对比原Volkov混合算法获得了显著的性能提升。关键词图形处理器乔里斯基分解加速比混合算法中图分类号 TP361    文献标识码 A    DOI:10.3969/j.issn.1000386x.2016.09.066ACCELERATINGCALCULATIONOFCHOLESKYFACTORISATIONOFMATRIXWITHGPUShenCong GaoHuotao(Schoo

3、lofElectronicInformation,WuhanUniversity,Wuhan430072,Hubei,China)Abstract  AconcreteimplementationofCholeskyfactorisationongraphicprocessingunit(GPU)forlargerealsymmetricpositivedefinitematrixisdescribedinthisarticle.Weanalysethehybridparallelalgorithmpresented

4、byVolkovforcomputingtheCholeskyfactorisationindetail.Onthatbasis,andaccordingtothecomputationalperformancesofCPUandGPUonourowncomputers,wepresentamorereasonablehybridthreephaseschedulingstrategy,whichfurtherreducestheidletimeofCPUandavoidstheoccurrenceofGPUi

5、nidlestatus.Numericalexperimentshowsthatthenewhybridschedulingalgorithmachievesaspeedupofmorethan5timescomparedwiththestandardMKLalgorithmwhentheorderofamatrixislargerthan7000,anditalsoobservablyoutperformstheperformanceoforiginalVolkovshybridalgorithm.Keywor

6、ds  GPU Choleskyfactorisation Speedup Hybridalgorithm阵算法在科学计算中广泛使用以及其处理的数据矩阵越来越0 引言大,研究使用GPU加速矩阵计算问题是十分必要的。CUBLAS是在GPU上实现的BLAS。利用CUBLAS库可以近年来,随着计算机技术的发展,图形处理器(GPU)越来很方便地移植CPU代码到GPU上进行加速计算。自2008年越强大,并且在计算能力上已经超过了通用CPU。使用GPU计Volkov等人提出CPU-GPU混合计算矩阵的LU、Cholesky和算可

7、以以低廉的价格获得巨大的计算性能,因此成为了科学计QR分解算法[5]以来,混合算法思想被广泛应用于各个计算领算领域的一个应用热点。自2007年NVIDIA公司推出了CUDA域,如流体仿真计算[6]、光线跟踪算法[7]等。混合算法思想也运算平台,并使用C语言为CUDA构架编写程序以来,GPU计因为Volkov等人的工作正逐步应用于各基本矩阵算法中,如矩算技术已经广泛应用于诸如信号处理、图像处理、信息安全等热阵的Hessenberg约化、二对角化以及矩阵的特征值求解中。使门领域中。在数值线性代数中,GPU可以用于加速大规

8、模的矩用CPU-GPU混合算法可以通过减少CPU的空闲时间,进一步阵计算问题,包括矩阵的分解和求特征值以及特征向量等。许加速矩阵计算。然而混合算法的性能很大程度上取决于调度算多组织和机构在GPU上实现了LAPACK库中的函数,并发布了法的优劣。好的调度方案可以最小化CPU与GPU的空闲时相关软件包以供科研人员使用。比较著名的软件包有CULA和间

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。