欢迎来到天天文库
浏览记录
ID:56058572
大小:390.50 KB
页数:5页
时间:2020-06-20
《基于CUDA的热传导GPU并行算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第40卷第5期计算机工程2014年5月V_01.40No.5ComputerEngineeringMav2014·先进计算与数据处理-文章编号:1000—3428(2014)05-0041—04文献标识码:A中图分类号:TP399基于CUDA的热传导GPU并行算法研究孟小华。,黄丛珊,朱丽莎。(暨南大学a.计算机科学系;b.天体测量、动力学与空间科学中法联合实验室,广州510632)摘要:在热传导算法中,使用传统的CPU串行算法或MPI并行算法处理大批量粒子时,存在执行效率低、处理时间长的问题。而图形处理单元(GPU)具有大数据量并行运算的优势,为此,在
2、统一计算设备架构(CUDA)并行编程环境下,采用CPU和GPU协同合作的模式,提出并实现一个基于CUDA的热传导GPU并行算法。根据GPU硬件配置设定Block和Grid的大小,将粒子划分为若干个block,粒子输入到GPU显卡中并行计算,每一个线程执行一个粒子计算,并将结果传回CPU主存,由CPU计算出每个粒子的平均热流。实验结果表明,与CPU串行算法在时间效率方面进行对比,该算法在粒子数到达16000时,加速比提高近900倍,并且加速比随着粒子数的增加而加速提高。关键词:热传导算法;图形处理单元;统一计算设备架构;并行计算;时间效率;加速比Resea
3、rch0nGPUParallelAlgorithm0fHeatConductionBased0nCUDAMENGXiao.hua,,HUANGCong.shah,ZHULi.sha’fa.DepartmentofComputerScience;b.Sino—FranceJointLaboratoryforAstrometry,DynamicsandSpaceScience,JinanUniversity,Guangzhou510632,China)[Abstract]Forrealapplicationsprocessinglargevolumeofpa
4、rticlesinone—dimensionalheatconductionproblem,theresponsetimeofCPUserialalgorithmandMPIparallelalgorithmistoolong.ConsideringGraphicProcessingUnit(GPU)oferspowerfulparallelprocessingcapabilities,itimplementsaGPUparallelheatconductionalgorithmonComputeUnifiedDeviceArchitecture(CUD
5、A)parallelprogrammingenvironmentusingCPUandGPUcollaborativemode.ThealgorithmsetstheblockandgridsizebasedonGPUhardwareconfiguration.Particlesaredividedintoapluralityofblocks,theparticleisintotheGPUgraphicsforparallelcomputing,andonethreadperformsacalculationofaparticle.Itretrieves
6、theprocesseddatatoCPUmainmemoryandcalculatestheaverageheatflowofeachparticle.Experimentalresultsshowthat,comparedwithCPUserialalgorithm,GPUparallelalgorithmhasagreatadvantageintimeeficiency,thespeedupiscloseto900,andspeedupcanimproveastheparticlenumbersizeincreases.【Keywordslheat
7、conductionalgorithm;GraphicProcessingUnit(GPU);ComputeUnifiedDeviceArchitecture(CUDA);parallelcomputing;timeeficiency;speedupratioDoI:10.3969/j.issn.1000-3428.2014.05.009十年中,传统的单CPU串行算法或者MPI并行算法被广泛l概述用来计算热传导中粒子的平均热流和平均温度,当粒子的热传导算法可以运用于很多领域,如建筑工程对各种数量太大时,这2种算法的执行时间太长。虽然图形处理材料的研究和选
8、择,以及地质勘探研究等方面,几乎所有单元(GraphicProcessingUn
此文档下载收益归作者所有