基于深度神经网络的场景分类方法研究

基于深度神经网络的场景分类方法研究

ID:35180681

大小:2.46 MB

页数:58页

时间:2019-03-21

基于深度神经网络的场景分类方法研究_第1页
基于深度神经网络的场景分类方法研究_第2页
基于深度神经网络的场景分类方法研究_第3页
基于深度神经网络的场景分类方法研究_第4页
基于深度神经网络的场景分类方法研究_第5页
资源描述:

《基于深度神经网络的场景分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10406分类号:TP391.4学号:130081202001南昌航空大学硕士学位论文(学位研究生)基于深度神经网络的场景分类方法研究硕士研究生:张永义导师:储珺教授申请学位级别:硕士学科、专业:计算机软件与理论所在单位:软件学院答辩日期:2016.05.31授予学位单位:南昌航空大学ResearchonSceneClassificationMethodBasedonDeepNeuralNetworkADissertationSubmittedfortheDegreeofMasteronComputersoftwareandtheor

2、ybyZhangYongyiUndertheSupervisionofProf.ChuJunSchoolofsoftwareNanchangHangkongUniversity,Nanchang,ChinaMay31th,2016南昌航空大学硕士学位论文摘要摘要资金资助:本论文得到国家自然科学基金项目(No.61263046,2013.01-2016.12)的支持和资助场景分类,或场景识别,是场景理解领域一个重要的研究方向,其依据就是按照人类视觉的组织原理,将不同的场景图像按照其语义信息划为不同的类别。在场景分类领域,一直都是采取人工提取图像特

3、征的方式,这种方式提取特征单一,不能很好描述各类场景,导致场景分类精度较低低。深度学习理论是建立在人工智能的基础之上,能够有效的描述图像的语义信息,准确地判断场景与场景和目标与目标之间的差异性和相似性。基于此种原因,本文采用深度神经网络的方法去自适应提取图像特征。分别采用自编码神经网络、人工神经网络以及卷积神经网络等模型来构造场景分类的方法,并在原来框架的基础之上进行改进。本文构造了一种新的基于自编码网络的分类方法用来识别室内场景。传统的人工神经网络在一些简单的识别领域中,如车牌识别和手写字符识别,取得了较好的识别效果,但是应用到场景识别中,识

4、别效果不是很理想。针对这种情况,采用一种基于自编码神经网络由粗到精的分类方法,粗分类主要采用自编码神经网络进行预训练,人工神经网络粗识别;细分类则采用支持向量机进行分类,HOG特征作为图像描述子,并在MIT-67室内场景数据集上进行验证。本文构造了一种新的卷积神经网络框架。传统卷积神经网络网络结构规模较小,采用单标签值的方式进行监督训练,这种单标签的机制只适合表示简单的图像类别,不足以表示复杂场景的类别。针对这种问题,本文在传统卷积神经网络框架的基础上进行改进,卷积层和采样层分别采用ReLu激活函数和Maxpooling采样,设有四个卷积层和四

5、个采样层,一个全连接层,一个分类层,并采用一种多标签值的标签进行训练。整个训练和识别过程采用一个统一的框架,并在Scene-15场景集上进行验证。本文利用MATLAB2014B+DeepLearningmaster来完成实验设计,在自编码神经网络和人工神经网络的训练中,使用了L-BFGS算法库来调整权值。本文提出的两种方法分别用于室内场景和自然场景的分类与识别。由粗到精的分类方法更符合人类认识事物的规律,并且采用自编码神经网络预训练;卷积神经网络处理图像的方式和生物视觉相类似,采用扩展的网络结构和多标签值机制来改造网络。最后,本文的两种方法的测

6、试结果与其他文献进行了比较,结果证明本文的方法具有一定效果。关键字:场景分类,自编码,卷积神经网络,深度学习I南昌航空大学硕士学位论文ABSTRACTABSTRACTSceneclassification,orscenerecognition,isanimportantresearchdirectioninthefieldofsceneunderstanding.Accordingtoprincipleofhumancognitionperspective,differentsemanticimagescanbedividedintodiffe

7、rentcategoriesthroughsceneclassification.Inthefieldofsceneclassification,theapproachisthatextractingfeaturebyhuman.Thedisadvantageofthemethodistoextractthefeatureofasingle,cannotdescribevariouswellandhavealowaccuracy.Thetheoryofdeeplearningwhichisbasedonartificialintelligenc

8、ecannotonlyextractdeepfeatureofimages,butalsoeffectivelydescribethesemantic

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。