基于异构平台的视频图像识别算法研究与实现

基于异构平台的视频图像识别算法研究与实现

ID:35178252

大小:4.94 MB

页数:74页

时间:2019-03-20

基于异构平台的视频图像识别算法研究与实现_第1页
基于异构平台的视频图像识别算法研究与实现_第2页
基于异构平台的视频图像识别算法研究与实现_第3页
基于异构平台的视频图像识别算法研究与实现_第4页
基于异构平台的视频图像识别算法研究与实现_第5页
资源描述:

《基于异构平台的视频图像识别算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、■...Sou化ChinaUniversitofTechnoloygy硕±学位论文基于异构平台的视频图像识别算法^硏究与实现作者姓名胡惠贤学科专业计算机科学与巧术指导教师陆髓教授所在学院计算机科学与工程学院论文提交日期2016年05月??.--.■?TheResearchandImplementofVideoImageRecognitionBasedonHeterogeneousComputingPlatformADis

2、sertationSubmittedfortheDegreeofMasterCandidate:HuHuixianSupervisor:Prof.LuLuSouthChinaUniversityofTechnologyGuangzhou,China10561分类号:;TP311学校代号学号:201420112643华南理工大学硕±学位论文基于异构平台的视频图像识别算法研究与实现、职:作者处名;胡惠巧指导教师姓名称陆城教授i计申请学恆级别:工学硕±学科专业名称算机科学与

3、技术研究方向:异构计算论文捉交曰胡年巧日巧丈普辩曰期:月A曰5斗方I护6学泣巧予单位:年月曰:华南理工大学巧位授予日拙醫辩委员会成员:主席;础劫化如说負卷壺巧:悼础^辟都作华南理工大学学位论文原创性声明本人那重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。驗了文中特别加料标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡已在文中明确方式标明。本人完全意识到本声明的献的个人

4、和集体,均法律后果由本人承担。|作者盛名:碱奢货曰期;从4年《月曰学位论文版权使用授权书留,即:本学位论文作者完全了解学校有关保、使用学位论文的规定研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被査阅(除在保密期内的保密论文外);学校可臥公布学化论文的全部用影印、汇编学位论、缩印或其它复制手段保存或部分内容,可允许采一文。本人电子文档的内容和纸质论文的内容相致。本□学位论文婦

5、于:于保密(校保密赛员会审定为涉密。学位论文时间:_年^月_曰),__材年_月_日解密后适用本授权书木保密,同意在校园网上发布,供校内师生和与学校有共享协议的志社全文单位浏览;同意将本人学位论文提交中国学播术期刊(光盘版)电子杂出版和编入CNKI《中图知识资"源总库)),传学位论文的全部或部分内容。V"(谱在W上相应方框内打)作者签名;棘容嚷、日期;如1自各‘7/指导教师签名:曰期:awM-?巧?!/]摘要近年来,深度神经网络的学术研究取得了喜人的突破,而如

6、何在实际应用中发挥人工智能的潜力仍然是一项艰巨的挑战。以计算机视觉为例,深度卷积神经网络的图像识别准确率虽然在ImageNet数据集上表现卓越,但这些成果距实际的商用还有很大的距离。一方面由于图像识别算法的复杂性,另一方面则由于图像处理和计算带来的算法复杂度对计算设备的性能的超高要求。后者催生了高性能计算在异构平台上的广泛应用,如使用GPU加速使深度神经网络的图像训练时间控制在可接受的范围之内。与此同时,视频网站在版权、网络带宽、服务器等资源上的高昂成本需要新的广告推荐模式平衡用户体验和商业收入。

7、基于以上立题背景,本文对已有的视频图像识别算法与技术进行研究分析,提出了一套用于解决垂直内容类的视频图像中的目标物品的定位和识别任务的基于异构平台的可行性方案。该方案的设计与实现包括主要三大部分的工作内容:(1)视频图像分割:对视频源进行预处理并获取帧图像,使用基于图表示的像素合并算法获取被分割区域后采取选择搜索策略获得可能存在目标对象的矩形框位置;(2)改进深度学习框架Caffe的跨平台性:使用异构编程语言OpenCL实现原生的基于CUDA的GPU加速功能,从而克服已有的Caffe只能在NVID

8、IA平台上进行运算加速的局限性;(3)训练卷积神经网络执行图像识别:使用ImageNet数据集对该模型进行训练得到能够识别目标对象的神经网络结构,将图像的识别结果与矩形框位置进行回溯映射定位视频中的目标物体位置。论文的实验部分对提出的方案的可行性和有效性进行了验证。为了实现识别的有效性实验的可视化,对图像分割结果包含区域矩形框和对应坐标位置通过图形编程对比神经网络的图像识别效果。实验还通过分析卷积神经网络不同神经层的输出结果理解卷积神经网络内部对图像特征的学习机制,印证了本文提出的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。