gpu流式计算模型应用的研究

gpu流式计算模型应用的研究

ID:34625457

大小:2.36 MB

页数:65页

时间:2019-03-08

gpu流式计算模型应用的研究_第1页
gpu流式计算模型应用的研究_第2页
gpu流式计算模型应用的研究_第3页
gpu流式计算模型应用的研究_第4页
gpu流式计算模型应用的研究_第5页
资源描述:

《gpu流式计算模型应用的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、』嬲煅嬲浙江大学研究生学位论文独创性声明.本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得滥婆盘鲎或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:年月’日学位论文版权使用授权书本学位论文作者完全了解逝’江盘堂有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝婆盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可

2、以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:签字日期:年月曰导师签名:签字日期:年月日浙江大学硕上学位论文摘要当前市场主流处理器的发展趋势是多核化/众核化,即通过提高处理器核心数目保持计算性能的持续增长。最新的图形处理器已经能够提高兆级的FLOPS理论峰值,远远超出了市场主流多核CPU。本文以国家自然科学基金项目(60803054)、浙江省自然科学基金项目(Y1100069)和AMD.浙江大学合作项目为研究背景,针对流式计算模型及其应用展开研究,主要工作包括:1、在NVIDIACUDA平台上实现了基因序列比对的分值计

3、算部分。本文设计实现的DiamondTiledWave舶m算法的效率能够达到传统的Tiledw打ef-ront算法的1.7倍,更充分的利用GPU的并行性,更快的返回两个序列串的局部最大匹配值。2、在NVIDIACUDA平台上实现了基因序列比对的精确比对部分。本文设计实现的流式序列比对算法首次在GPU上实现精确返回各元素的位置匹配结果。3、在ATIS仃e锄平台上实现了三维模型凸包生成算法。在GPU上解决了CPU代码中大量应用vector、queue、map数据结构的问题。同时本文也介绍了一些用于辅助或优化上述算法实现的通用流式算法。4、在NVIDIAGeForceGD(285和AT

4、I&deon5870图形处理器上使用CUDA和OpenCL实现了以上算法,并使用一系列模型进行了测试。本文算法对于基于GPU的算法加速研究具有一定的通用意义,并能延伸到其他生物计算、几何处理等领域的相关问题。关键词:图形处理器,流式计算,序列比对,凸包生成浙江大学硕士学位论文AbstractThecurrenttIIendofcommodi够processorsistowardsdeVelopingmulit—core/maIly—coreprocessors.Byincreasingthen啪berofprocessorcores,mepeal(pe—’omaIlcesarek

5、e印inghi曲-speedimproVement.111elatestgraphicsprocessoruIlits(GPUs)arecapableofacllieVingtemFLOPSint11eoⅨwhichissup耐ortothecommod毋muhi—coreCPUs.1Hspaperfocusesontheresearchofstre锄computingmodelonGPUa11dits印plications.TheresearchissupportedinpartbyNationmNa_tIlralScieIlceFouIldation(60803054),Zh

6、ejiangProVincialNaturalScienceFoulldation(Yl1o0069)aIldAMD-ZhejiallgUniVerSit),cooperationproject.111emaincontributionsare:1.WeacllieVedthescorecalculationofbiologicalsequencealigmnent0nNVIDIACUDA.DesignedaIldimplememedanewparallelalgorithm彻medDi锄ondTiled毗lve舫ntalg鲥tllIll,砌chc锄achievetheemcie

7、ncy1.7timestlle触ditionalTiledW打e劬ntalgorithm’s,better“lizetheGPUparallelism,andf缸erretum廿lelocalmaXim眦matchValueoft、№sequences·2.WeacIlievedtheaccuratefbllali鄂mentofbiologicalsequenceali班lentonCUDA.Asweknow,t11estre锄sequenceadigIlIIlentalgori

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。