基于gpu的高性能并行优化算法研究

基于gpu的高性能并行优化算法研究

ID:33495444

大小:7.75 MB

页数:116页

时间:2019-02-26

基于gpu的高性能并行优化算法研究_第1页
基于gpu的高性能并行优化算法研究_第2页
基于gpu的高性能并行优化算法研究_第3页
基于gpu的高性能并行优化算法研究_第4页
基于gpu的高性能并行优化算法研究_第5页
资源描述:

《基于gpu的高性能并行优化算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据博士学位论文基于GPU的高性能并行优化算法研究High-PerformanceParallelOptimizationAlgorithmBasedonGPU学号:』幽鲤答辩日期:星Q!垒生12旦圣旦大连理工大学DalianUniversityofTechnology万方数据大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他已申请学位或其他用途使用过的

2、成果。与我一同工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:基王鱼里堕鲍直性能羞短笾丝簋法婴塞作者签名:奎箜吼盟年旦月上日大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论

3、文。学位论文题目:基王壁堕丝高丝篮羞短垡丝篡洼堡窥答辩委员会主席:j扛迢L吼蝉年上月产日万方数据大连理工大学博士学位论文摘要随着高性能并行计算设备的目益普及,特别是高性能图形处理器(GPU)的迅猛发展,基于GPU高性能计算平台的并行优化应用服务解决方案引起国内外研究学者的极大关注。由于传统CPU、计算集群在计算资源以及能耗方面的限制,以及各类科学工程优化问题对于并行计算需求的不断提升,基于高性能并行计算的扩展模型、仿真计算、算法优化以及数值计算已经成为当前高性能计算的研究热点。高性能并行优化算法作为衔接底层并行计算平台

4、及上层应用服务的关键部分,在算法性能的优化以及应用空间的扩展方面仍然存在严峻挑战和亟需解决的问题,需要对算法优化和数值计算问题的方法和技术不断提高和完善。基于此,本文将重点进行高性能并行计算随机数生成、智能算法优化和数值计算算法等方面的研究创新。针对随机数生成器、蚁群算法、最小平方估计等问题,采用GPU扩展加速比模型、GPU局部优化等技术,设计并提出三个关键的并行优化解决方案。主要研究内容和创新点如下:(1)针对传统随机数生成速度较慢及加速优化模型扩展性较差的问题,通过对当前可扩展加速优化模型及随机数生成器机制的分析总

5、结,给出一种考虑存储层次的GPU可扩展加速比优化模型,并基于该模型提出了一种简单的高性能并行计算随机数生成算法f简称为CUDA—RNG),该算法充分利用了GPU间的协同计算能力,最终可以生成高效率的随机数序列。实验结果表明,CUDA.RNG算法能够在连续计算运行时达到189。32倍的生成速度,且具有很小的内存负载开销。(2)针对蚁群算法在大规模的最优化问题中难以得到最优解的问题,受蚁群算法在本质上具有并行性特点的启发,着重研究如何在GPU并行计算环境下提高蚁群算法的性能及效率。通过对TSP(旅行商)问题的蚁群算法建模,

6、提出一种新的基于CUDA(统一计算设备架构)的蚁群优化算法,简称为GACO。该算法结合了MMAS(MAX.MINAntSystem)禾HACS(AntColonySystem)l拘共性特点进行混合信息矩阵更新、动态构建最短邻接路径和多路蚁群分布等优化策略。最后对GPU的性能优化方案做了分析,通过使用这些优化策略使得该算法跟同等类型的算法相比具有更高的速度和质量。实验结果表明,本文提出的GACO算法性能在搜索加速度上分别比ACS、MMAS要高出40.1倍与35.7倍。(3)针对在数据规模较大情况下利用奇异值分解求最小平方

7、时的时间消耗和内存空间代价过大的问题,提出了一种基于GPU的迭代式分割与合并的奇异值分解最小平方估计法,简称为IDMSVD。该算法可以有效的改善对于大型数据利用奇异值分解求最万方数据基于GPU的高性能并行优化算法研究小平方问题时的运算时间和内存空间。最后在GPU的CUDA计算架构的中进行了实现,通过实验验证了算法的有效性。本文所提出的算法具有普适意义,能够轻松地转移到其他的并行计算设备上,比如多核CPU或者大规模集群设备。更高性能的加速平台如CPU和GPU混合构架(或GPU集群)、GPU和FPGA(现场可编程门阵列)混

8、合构架等都有望应用到高性能并行优化算法的研究中。并关键词:GPU并行计算;随机数生成器;可扩展模型;蚁群优化;迭代式分割与合万方数据大连理工大学博士学位论文ABSTRACTWithhigh—performanceparallelcomputingdevicesbecomeincreasinglypopular,especially

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。