基于CUDA的热传导GPU并行算法研究.pdf

基于CUDA的热传导GPU并行算法研究.pdf

ID:56058572

大小:390.50 KB

页数:5页

时间:2020-06-20

基于CUDA的热传导GPU并行算法研究.pdf_第1页
基于CUDA的热传导GPU并行算法研究.pdf_第2页
基于CUDA的热传导GPU并行算法研究.pdf_第3页
基于CUDA的热传导GPU并行算法研究.pdf_第4页
基于CUDA的热传导GPU并行算法研究.pdf_第5页
资源描述:

《基于CUDA的热传导GPU并行算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第5期计算机工程2014年5月V_01.40No.5ComputerEngineeringMav2014·先进计算与数据处理-文章编号:1000—3428(2014)05-0041—04文献标识码:A中图分类号:TP399基于CUDA的热传导GPU并行算法研究孟小华。,黄丛珊,朱丽莎。(暨南大学a.计算机科学系;b.天体测量、动力学与空间科学中法联合实验室,广州510632)摘要:在热传导算法中,使用传统的CPU串行算法或MPI并行算法处理大批量粒子时,存在执行效率低、处理时间长的问题。而图形处理单元(GPU)具有大数据量并行运算的优势,为此,在

2、统一计算设备架构(CUDA)并行编程环境下,采用CPU和GPU协同合作的模式,提出并实现一个基于CUDA的热传导GPU并行算法。根据GPU硬件配置设定Block和Grid的大小,将粒子划分为若干个block,粒子输入到GPU显卡中并行计算,每一个线程执行一个粒子计算,并将结果传回CPU主存,由CPU计算出每个粒子的平均热流。实验结果表明,与CPU串行算法在时间效率方面进行对比,该算法在粒子数到达16000时,加速比提高近900倍,并且加速比随着粒子数的增加而加速提高。关键词:热传导算法;图形处理单元;统一计算设备架构;并行计算;时间效率;加速比Resea

3、rch0nGPUParallelAlgorithm0fHeatConductionBased0nCUDAMENGXiao.hua,,HUANGCong.shah,ZHULi.sha’fa.DepartmentofComputerScience;b.Sino—FranceJointLaboratoryforAstrometry,DynamicsandSpaceScience,JinanUniversity,Guangzhou510632,China)[Abstract]Forrealapplicationsprocessinglargevolumeofpa

4、rticlesinone—dimensionalheatconductionproblem,theresponsetimeofCPUserialalgorithmandMPIparallelalgorithmistoolong.ConsideringGraphicProcessingUnit(GPU)oferspowerfulparallelprocessingcapabilities,itimplementsaGPUparallelheatconductionalgorithmonComputeUnifiedDeviceArchitecture(CUD

5、A)parallelprogrammingenvironmentusingCPUandGPUcollaborativemode.ThealgorithmsetstheblockandgridsizebasedonGPUhardwareconfiguration.Particlesaredividedintoapluralityofblocks,theparticleisintotheGPUgraphicsforparallelcomputing,andonethreadperformsacalculationofaparticle.Itretrieves

6、theprocesseddatatoCPUmainmemoryandcalculatestheaverageheatflowofeachparticle.Experimentalresultsshowthat,comparedwithCPUserialalgorithm,GPUparallelalgorithmhasagreatadvantageintimeeficiency,thespeedupiscloseto900,andspeedupcanimproveastheparticlenumbersizeincreases.【Keywordslheat

7、conductionalgorithm;GraphicProcessingUnit(GPU);ComputeUnifiedDeviceArchitecture(CUDA);parallelcomputing;timeeficiency;speedupratioDoI:10.3969/j.issn.1000-3428.2014.05.009十年中,传统的单CPU串行算法或者MPI并行算法被广泛l概述用来计算热传导中粒子的平均热流和平均温度,当粒子的热传导算法可以运用于很多领域,如建筑工程对各种数量太大时,这2种算法的执行时间太长。虽然图形处理材料的研究和选

8、择,以及地质勘探研究等方面,几乎所有单元(GraphicProcessingUn

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。