雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf

雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf

ID:52930764

大小:473.95 KB

页数:8页

时间:2020-04-01

雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf_第1页
雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf_第2页
雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf_第3页
雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf_第4页
雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf_第5页
资源描述:

《雅可比迭代的CPU_GPU并行计算及在CFD 中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、*雅可比迭代的CPU/GPU并行计算及在CFD中的应用李大力,张理论,徐传福,刘巍(国防科学技术大学计算机学院,湖南长沙410073)CPU/GPUHybridParallelAlgorithmofJacobiIterationandit’sApplicationinCFD*LiDa-Li,ZhangLi-Lun,XuChuan-Fu,LiuWei(SchoolofComputerScience,NationalUniversityofDefenceTechnology,Changsha410073,China)Abstract:Inthispaper,thechara

2、cteristicsofmulti-coreandmany-corearchitectureareintegratedtoachievethecollaborativeparallelcomputingofCPUandGPUforarealCFDapplication.BasedonnestedOpenMPthread,weimplementOpenMP/CUDAhybridparallizationofJacobiiterativemethod,andalsouseitfortheaerodynamics_simulationofstructuralgridflowf

3、ield.Forasingle-zonetestcasewith2milliongrids,thespeedupofGPUaccelerationofcomputationforRight-Hand-Side,Left-Hand-Sidematrixandit'sinverse,andJacobiiteration,is11.35,13.83and8.34respectively,andthewholespeedupis9.86.Forthetestcasewiththesametotalgridsand4datazones,thewholespeedupofGPUco

4、mputingandtheCPU/GPUcollaborativecomputingis5.56and7.49respectively.Keywords:Jacobiiteration;GPU;CFD;TH-1A;Heterogeneoushybridparallel摘要:本研究从CFD实际应用背景出发,综合多核与众核的特点,采用OpenMP线程嵌套以实现CPU/GPU的协同并行计算,实现了雅可比迭代法的GPU加速以及OpenMP/CUDA混合并行算法,并将其用于结构网格气动外流场的数值模拟。对单区200万结构网格数据,右端项、左端项矩阵及矩阵求逆、雅可比迭代等核心计算

5、部分的GPU并行分别取得了11.35、13.83和8.34倍的加速比,整个求解过程取得了9.86倍的加速比;对200万4区结构网格数据,整个求解过程的GPU并行加速比为5.56,CPU/GPU协同并行的加速比为7.49。关键词:雅可比迭代;图形处理器;计算流体力学;天河-1A;异构混合并行1引言以NVIDIA公司Fermi架构为代表的通用图形处理器(GPGPU)支持双精度浮点计算,大大拓宽了图形处理器在大规模科学计算中的应用。近几年来TOP500排行榜中利用通用图形处理器加速计算的系统数量不断增长。[1]截至2012年6月,使用加速器的超级计算机数量为58台,使用NVI

6、DIAGPU加速的有53台;其中包括我国的[2]“天河-1A”系统,其计算结点采用一颗TeslaM2050的GPU和两颗IntelXeonX5670的CPU。Table1StatisticalchartofTOP500Supper-Computeraccelerator(June,2012)表格12012年6月TOP500的超级计算机中使用加速器的统计表加速器类别数量所占比例(%)总的最大持续性能(GFlops)总的峰值性能(GFlops)总核心数N/A44288.4107103147.87140616821.2112004293NvidiaFermi5310.6146

7、63388.8428888263.121250784IBMCell20.411685001537632136800ATIRadeon20.4364150647436.226268IntelMIC10.21186001809929800*SupportedbytheNationalGrandFundamentalResearch973ProgramofChinaunderGrantNo.G2009CB723803(国家重点基础研究发展规划(973)).作者简介:李大力(1983-),男,湖北广水人,硕士,学员,主要研究领域为高性能计算,GP

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。