欢迎来到天天文库
浏览记录
ID:33547897
大小:12.98 MB
页数:72页
时间:2019-02-27
《基于gpu和多核cpu的并行高阶矩量法的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、隶韵大·璺硕士学位论文基于GPU禾I多核CPU的并行高阶矩量法的实现专业名称:电磁场与微波技本研究生姓名:陈康导师姓名:周后型教授本论文获国家公益性行业科研专项(201110046—2)和国家基础科学研究项目(2010CB327400,2013CB329002)的资助。REALIZATIoNoFPARALLELHIGHER.oRDERMETHoDoFMOMENTSBASEDONGPUANDMULTI—CORECPUADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofScience
2、ByCHENKangSupervisedbyProfessorZHOUHou--XingStateKeyLaboratoryofMillimeterWavesSchoolofInformationScienceandEngineeringSoutheastUniversityJanuary10,2014东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同
3、志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:日期:2壁经!墨:;东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括以电子信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括以电子信息形式刊登)授权东南大学研究生院办理。研究生签名:导师签名:麴日期:摘要电大目标电磁散射特性的快速分析方法一直是计算电磁学界的一个热点
4、。在早期的矩量法中,局域基函数是低阶基函数(主要是RWG基函数),产生的未知量个数比较多,特别是对于电大目标问题。基于积分方程和矩量法的快速算法是目前求解电大目标电磁散射问题的常用算法,并采用迭代求解器求解矩量法矩阵方程。快速算法能够显著地降低每次迭代的计算复杂度和存储复杂度,但以适当牺牲数值精度为代价。近些年来,高阶基函数(特别是Legendre准正交基函数)被引入矩量法,以大幅度减少未知量个数,并适当提高数值精度。在大面片上采用高阶基函数的矩量法(高阶矩量法)已经成为电磁学界的一个热点。本文研究基于GPU和多核CPU的并行高阶矩量法的实现,重点在于高阶矩量法矩阵的快速
5、生成方法。本文主要工作如下:1.提出了两个加速方法:一是将现有的共用Green函数法扩展为“共用Green函数与共用方向向量相互作用法”;二是将高阶基函数按阶数高低进行分组积分的方法,即“基函数按阶分组法”。在这两个方法以及现有的高阶基函数积分表法基础上,研究7"OpenMP控制多核CPU生成高阶矩量法矩阵的并行计算程序的实现方法;2.提出了将高阶矩量法的CPU串行程序直接向GPU环境移植的方法。高阶矩量法矩阵的生成是一项计算密集型的工作,特别适合用众核GPU来提速。但是,在基于GPU的编程中要处理各种存储器之间的关系,比在基于多核CPU的情形复杂得多。文献中给出的是直接
6、将针对采用RWG基函数的矩量法的GPU实现演变为针对高阶矩量法的,仅获得3倍左右的加速。本文的GPU程序实现是优化的,达到了20倍以上的加速;3.提出了高阶矩量法矩阵在并行环境中高效计算的一种分块方法,非常匹配从GPU高效显存蛩]CPU主内存的连续拷贝机制,避免YGPU与CPU间反复多次的小内存交互。该方法不仅可以基于内存来扩大计算规模(核内存储版本),还可以让内存结合硬盘来进一步扩大计算规模,即演变为带核外存储的GPU力I速程序(核外存储版本)。关键词:电磁散射,高阶基函数,高阶矩量法,快速算法,并行算法,OpenMP,GPU,CUDA,核内存储,核外存储。Abstra
7、ctFastanalyzingelectromagneticscatteringcharacteristicsofelectricallylargeobjectshavebeenahottopicinthecomputationalelectromagnetism.Intheearlymethodofmoments,localbasisfunctionsarelower-orderbasisfunctions(mainlyRWGbasisfunctions)thenumberofunknownvariablesproduced
此文档下载收益归作者所有