欢迎来到天天文库
浏览记录
ID:37065449
大小:2.38 MB
页数:125页
时间:2019-05-17
《基于GPU的Zemike矩快速算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于GPU的Zernike矩快速算法研究FastcomputationresearchofZernikemomentsbasedonGPU作者姓名:玄玉波专业名称:应用物理指导教师:韩炜学位类别:理学博士论文答辩日期:2018年5月23日授予学位日期:年月日答辩委员会组成:姓名职称工作单位主席汪尔康院士中科院长春应用化学研究所委员朱广山教授东北师范大学化学学院彭增辉研究员中科院长春光学精密机械与物理研究所刘冰冰教授吉林大学贺天民教授吉林大学未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均
2、不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学博士学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:2018年5月23日《中国优秀博硕士学位论
3、文全文数据库》投稿声明研究生院:本人同意《中国优秀博硕士学位论文全文数据库》出版章程的内容,愿意将本人的学位论文委托研究生院向中国学术期刊(光盘版)电子杂志社的《中国优秀博硕士学位论文全文数据库》投稿,希望《中国优秀博硕士学位论文全文数据库》给予出版,并同意在《中国博硕士学位论文评价数据库》和CNKI系列数据库中使用,同意按章程规定享受相关权益。论文级别:□硕士博士学科专业:应用物理学论文题目:基于GPU的Zernike矩快速算法研究作者签名:指导教师签名:年月日作者联系地址(邮编):吉林省长春市南湖大路5372号130
4、012作者联系电话:13596103291摘要基于GPU的Zernike矩快速算法研究Zernike矩是图像映射在一组Zernike多项式上的正交系数,它能去除表达图像信息的冗余性,对图像噪声等相关操作具有较高的鲁棒性。同时,由于Zernike多项式定义在复数域的单位圆内,因此,它的幅值具有本质上的旋转、平移、尺度不变性。这些出色的特性,使其广泛应用于图像分析、模式识别和光学等领域。本文针对Zernike矩的定义复杂、计算速度慢、以及计算精度低等问题,研究并确定了适合Zernike矩在内切圆和外接圆两种映射下的精度算法;提
5、出预存径向多项式系数消除计算阶乘引起的精度限制;提出Zernike矩的快速算法,并分析了在GPU中实施的困难和瓶颈,最终对GPU快速计算Zernike矩进行了高效的优化。本论文的主要内容和创新点包括以下四个方面:(1)针对Zernike矩中阶乘计算存在的局限,即单精度和双精度只能计算到18阶和40阶,提出了预存径向多项式系数,有效消除了阶乘计算和递归算法中不能计算单个矩的限制,并且提高了矩的计算阶数。同时,计算时间比递归算法及预存阶乘算法更短。(2)提出基于GPU的八卦限对称性算法,并提出数据重排序结合对角线像素预处理的数
6、据重布局方案。在提取对称点时,重布局方案有效避免使用循环条件语句,进而避免线程分歧。重布局后的数据访问是合并的,确保了获得最大的内存带宽。(3)将以上提出的预存径向多项式系数和八卦限对称性算法结合,混合算法进一步缩短了计算时间。同时,克服了以往使用递归算法不能求单个矩的限制。在大尺寸图像中其性能显著地优于GPU的直接法。(4)提出组合线程块Block在一个内核Kernel中的组包方案。该方案极大地提高了资源利用率,收回了混合算法在小尺寸图像中丢失的计算性能。在GPU加速的方法论上有三个贡献:(1)如果图像处理的区域是扇形或
7、者不规则的区域,重布局方案能避免使I用条件语句提取这些区域的点。重排序的顺序是数据重布局的关键,尽管它需要额外的开销,但是在后续的处理中合并访问全局内存,最大程度上优化了GPU的性能。(2)有效利用GPU的存储器空间。将被计算的数据预存到GPU存储器,在计算中通过查找表提取。常量存储器的存储方案避免了高频的进行重复的计算,节省了计算时间。简而言之,它是一种用内存空间换取计算时间的策略。(3)在GPU流处理器空闲引起占用率低、资源闲置的情况下,如果应用中不同任务具有相同的执行代码,不同的输入输出参数,则可以使用组包方案提高资
8、源利用率,进而减少计算时间。例如:任意其它类型矩的计算、图像匹配中SIFT算法的高斯金字塔计算等都符合我们的组包条件,它们的计算性能可通过组包方案进一步提高。占用率越低,组包方案越有效。本文采用了英伟达公司的GPU通用并行计算架构(ComputeUnifiedDeviceArchitecture,CUD
此文档下载收益归作者所有