基于gpu和mic架构的边缘检测算法优化研究

基于gpu和mic架构的边缘检测算法优化研究

ID:35056791

大小:3.64 MB

页数:68页

时间:2019-03-17

基于gpu和mic架构的边缘检测算法优化研究_第1页
基于gpu和mic架构的边缘检测算法优化研究_第2页
基于gpu和mic架构的边缘检测算法优化研究_第3页
基于gpu和mic架构的边缘检测算法优化研究_第4页
基于gpu和mic架构的边缘检测算法优化研究_第5页
资源描述:

《基于gpu和mic架构的边缘检测算法优化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC:学号:406130713157南昌大学硕士研究生学位论文基于GPU和MIC架构的边缘检测算法优化研究ResearchofEdgeDetectionAlgorithmOptimizationBasedonGPUandMICArchitecture吴志平培养单位(院、系):信息工程学院电子系指导教师姓名、职称:赵庆敏教授申请学位的学科门类:工学硕士学科专业名称:电子与通信工程论文答辩日期:2016年5月21日答辩委员会主席:评阅人:2016年月日一、学位论文独创牲声明本人声明所呈交的学位论义是本

2、人在导师指导K进行的研究」:作及取得的研究成果。扼我所知,除了义中特别加臥柄注和致谢的地外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南吕大学或其他教巧机构的学位或证书而使用过的材料-。与我同;L:作的巧志对本硏究所做的任何贡献均已在论支中作了明确的说明井衷示谢意。学位论文作者签名(手写):签字R期月R;^年^扳>/^6考^二、学位论文版权使用授权书本学位论文作者完全了解南旨大学有关保留、使用学位论文的规定,问意?学校有权保留并向罔家有关部口或机构送交论支的算印件

3、和电-/版,允许论文被普阅和借閒。本人授权南目大学可段将学位论文的全部或部分内容编入有关n数据库进行检索,fW采用影印、缩印或扫描等复制手段保存、汇编本学位论文。巧M授权北京如必数据股份巧限公司和中園学术期刊(化盘版)化平杂志社将本学化论义收破到《中国学位论义全义数扼库》和《中齒优秀博硕上学位论义全文数据库》中乎:文发衷,并通边网络向社会公众提供信总服务,问意按""章程规定帛受相义权益。学位论文作者签名(手气):导师签名(手写):心7詞命箱字n期:年i?月鬥辖字n期:心年^月会H

4、j.论义题白l/j口MfL掏;vt處旅店成化刊技/!皋子邱声呵与名i学号八67'm7落品别隱寸:□硕±国禾已—院席/所种灰j令郎/I专业i停良另盈斥巧IjmE—ail: ̄i备注"化密",午公巧)^西公开□保常(向投学化办中诉获批准为摘要摘要CPU/GPU和CPU/MIC等异构协同计算系统既提供了强大的计算能力,又兼顾通用性和效能,是当前高性能计算的主流架构类型。然而其复杂的硬件结构和独特的编程模型,使得用户编程和性能优化,成为发挥整个系统性能的关键。在高分辨率的图像日益普

5、及的情况下,边缘检测的运算速度对后续图像处理和计算机视觉的研究有着更为重大的影响。如何在特定的异构架构系统平台上,最大限度的提高边缘检测的运算速度和代码效率是本文的研究重点。本文将数字图像处理中的边缘检测算法与GPU/MIC相结合,并对边缘检测算法和CPU/GPU/MIC异构架构的性能优化展开深入的分析和研究。首先回顾了GPU硬件发展历程及CUDA编程模型等相关知识。分析了边缘检测算法的并行性,并在CPU和CPU/GPU上实现。通过一系列优化手段,包括循环展开、指令访问优化和共享存储器访问优化等,使得运算速度最快。并

6、通过与CPU/MIC异构架构的横向比较,分析CPU/GPU的计算特点。本文提出了一种参数自选方法,让程序可以根据硬件配置来智能的选择运行参数。针对高斯滤波加Roberts算子的边缘检测的CUDA程序加以分析,通过Kernel函数整合的方式,加快了程序的运算速度。随后通过对Kirsch算法的研究,提出了一种改进的方案,并在GPU平台上加以实现和针对性地优化。最后通过实验结果验证了改进方案的有效性。关键词:GPU;MIC;边缘检测;Kirsch算子;CUDAIAbstractABSTRACTThemainstreamty

7、peofhigh-performancecomputingarchitecturesatpresentisCPU/GPUandCPU/MICheterogeneouscooperativecomputingsystem,whichprovidesapowerfulcomputingcapability,versatilityandeffectiveness.However,becauseofthecomplexityofhardwarearchitectureandthespecialtyofprogrammingm

8、odel,userprogrammingandperformanceoptimizationhasbecomeakeyinoverallsystemperformance.Asthegrowingpopularofhigh-resolutionimages,thespeedofedgedetectionhasbecomemoreandmorei

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。