基于卷积神经网络的场景理解方法研究

基于卷积神经网络的场景理解方法研究

ID:23517945

大小:4.12 MB

页数:83页

时间:2018-11-08

基于卷积神经网络的场景理解方法研究_第1页
基于卷积神经网络的场景理解方法研究_第2页
基于卷积神经网络的场景理解方法研究_第3页
基于卷积神经网络的场景理解方法研究_第4页
基于卷积神经网络的场景理解方法研究_第5页
资源描述:

《基于卷积神经网络的场景理解方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP181密级:公开UDC:621.3学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于卷积神经网络的场景理解方法研究论文作者:杨飞学科:控制科学与工程指导教师:杨金福副教授论文提交日期:2017年5月UDC:621.3学校代码:10005中文图书分类号:TP181学号:S201402149密级:公开北京工业大学工学硕士学位论文题目:基于卷积神经网络的场景理解方法研究英文题目:SCENEUNDERSTANDINGBASEDONCONVOLUTIONALNEURALNETWORK论文作者:杨飞学科:控制科学与

2、工程研究方向:模式识别与智能系统申请学位:工学硕士指导教师:杨金福副教授所在单位:信息学部答辩日期:2017年5月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:杨飞日期:2017年5月24日关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论

3、文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:杨飞日期:2017年5月24日导师签名:杨金福日期:2017年5月24日摘要摘要随着科技的发展和人类生活水平智能化的提高,智能服务机器人逐渐进入到人类生产生活中,并且被广泛地应用到了各个行业。机器人服务人类时,首先且最重要的是需要建立对周围环境的认知与理解。而视觉是机器人获取外部信息的主要传感器,因此,基于视觉的场景理解能力直接影响着机器人智能化水平的发挥。近年来,基于视觉的机器

4、人环境认知和理解得到了越来越多研究人员的关注,并获得大量令人瞩目的研究成果。然而,大多数的研究方法,采用人工定义的特征,不能全面表达图像隐含信息,而且特征表达缺乏人类能够理解的高层语义信息,致使机器人无法准确完成其他特定任务。随着目前深度学习的发展,尤其是卷积神经网络在图像识别领域中取得的优异性能,卷积神经网络被广泛应用到机器视觉领域中。卷积神经网络模仿人类视觉机制,能够更加全面表达图像信息,更适合于实际应用。但是针对较为复杂的场景理解任务,卷积神经网络还具有一定局限性,例如全局卷积神经网络激活值把图像信息抽象成了一维语义信息,忽视了图像中层语义信息和物体的

5、细节信息。此外,由于卷积神经网络的池化特性,导致其降低了图像几何变换的不变性。本文围绕机器人环境理解问题,从场景识别和场景解析两个角度,探索基于卷积神经网络的场景理解方法,主要研究内容包括:(1)针对卷积神经网络特征存在的缺乏中层物体部件信息问题,提出了一种融合中层语义部件与卷积神经网络的场景识别方法。首先,学习中层局部语义部件,得到具有代表该类场景的中层图像特征表达;然后,将中层特征表达与卷积神经网络特征融合;最后,利用SVM分类器进行分类。在多个数据集上进行了对比试验,取得了相比其他方法较好的识别结果。研究过程中也发现,虽然所提出的方法在识别简单场景(例

6、如场景中主要部分为物体)时,取得了较好的效果,但是还不能很好地处理复杂场景的图像。(2)针对全局卷积神经网络激活值缺乏对复杂场景图像几何变换的不变性,并考虑到网络结构中卷积层与全连接层特征表达的独特性,提出了一种基于卷积神经网络的多通道-多尺度无序池化的场景识别方法。首先,利用卷积神经网络提取图像的多个尺度下的卷积特征与全连接层特征;然后,将得到的特征进行池化聚合,得到最终的图像特征表达;最后,利用SVM分类器进行场景的识别。在多个数据集上的实验,结果表明,我们的方法取得了很好的识别性能。此外,为了进一步提高正确识别率,将主要基于物体特征的ImageNetC

7、NN网络与主要基于场景特征的PlacesCNN网络与ImageNetCNN网络进行融合,取得了相比I北京工业大学工学硕士学位论文于其他流行方法更高的正确识别率,验证了所提出方法的有效性。(3)针对编码-解码网络中对图像解析中物体边缘分割的模糊性以及对小物体分割时存在的不确定性问题,提出了一种基于超像素分割深度编码-解码金字塔池化结构的场景解析方法。首先,利用编码-解码网络提取图像特征;然后,利用多尺度空间金字塔池化结构对特征池化,整合全局信息与局部信息,增强网络对较小物体的解析,同时也增加网络中空间上下文环境信息,并训练两层的神经网络分类器;接着,对原图像进

8、行基于图的分割,使得物体边缘更加清晰;最后,利用分类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。