欢迎来到天天文库
浏览记录
ID:34917514
大小:2.33 MB
页数:61页
时间:2019-03-14
《基于张量分解与卷积神经网络的RGB-D物体识别方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕士学位论文(工学硕士)基于张量分解与卷积神经网络的RGB-D物体识别方法余霆嵩二〇一八年六月分类号:学校代号:11845UDC:密级:学号:2111503009广东工业大学硕士学位论文(工学硕士)基于张量分解与卷积神经网络的RGB-D物体识别方法余霆嵩指导教师姓名、职称:文元美副教授学科(专业)或领域名称:信息与通信工程学生所属学院:信息工程学院论文答辩日期:2018年06月ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeofMaste
2、rofEngineeringScience(MasterofEngineeringScience)RGB-DobjectrecognitionmethodbasedontensordecompositionandconvolutionalneuralnetworkMasterCandidate:YuTingsongSupervisor:AssociateProf.WenYuanmeiJun2018SchoolofInformationEngineeringGuangdongUniversityofTechnologyGuangzhou
3、,Guangdong,P.R.China,510006摘要摘要物体识别是计算机视觉领域一个重要的研究方向,其主要目的是为了让计算机可以“看”懂真实世界中的物体,让计算机拥有感知物体的能力。在图像数据激增的时代,计算机自动识别图像中物体的能力将极大地提高人们处理图像、挖掘图像和管理图像的工作效率,因而有着巨大的应用前景。深度传感器的出现使得新一代相机可以获取物体的RGB-D图像,其中的深度图像弥补了RGB图像中缺少的物体空间结构信息。如何将RGB-D图像与物体识别技术有效地结合起来,提高物体识别准确率成为了计算机视觉领域的一个新的研究热
4、点。本文围绕RGB-D物体识别技术,针对RGB-D图像融合及预测模型搭建问题,开展了基于张量分解与卷积神经网络的RGB-D物体识别方法的研究。提出了基于张量分解的RGB-D融合方法和基于边缘检测的卷积核数量确定方法。本文主要贡献如下:(1)设计了基于张量分解与卷积神经网络的RGB-D物体识别总体框架。该框架包含RGB-D图像融合及预测模型搭建两个模块。其中RGB-D图像融合模块主要包括图像预处理和张量分解;预测模型搭建模块中采用卷积神经网络模型作为预测模型。(2)针对RGB-D物体识别中如何有效利用深度图像中的空间结构信息来提高识别准
5、确度的问题,提出了基于张量分解的RGB-D图像融合方法。该方法主要借鉴张量分解的优势——擅长处理多模态数据,创造性地用张量分解方法解决RGB-D图像融合问题。该方法首先分析RGB-D图像数据性质,再构造成对应的张量;然后,利用Tucker方法对张量进行分解,获得因子矩阵;最后通过因子矩阵对原张量进行投影,获得融合后的RGB-D图像。仿真实验结果表明该方法可提高物体识别准确率,在三个子数据集中,分别可提高19%、7%和11%。(3)针对卷积神经网络预测模型中卷积核数量多凭经验确定的问题,提出了基于边缘检测的卷积核数量确定方法。该方法首先
6、对训练图像进行边缘检测获得边缘图像,然后对边缘图像进行边缘块提取并统计提取的边缘块,最后通过对边缘特征矩阵进行分析获得卷积核数量。通过在Mnist数据集和Chars74K数据集上的实验结果表明,该方法能依据图像集自适应的增加或减少卷积核数量,具有自适应能力。关键词:物体识别;RGB-D图像;张量分解;卷积神经网络I广东工业大学硕士学位论文AbstractObjectrecognitionisanimportantresearchdirectioninthefieldofcomputervision.Itsmainpurposeisto
7、enablecomputersto“see”theobjectsintherealworldandallowcomputerstohavetheabilitytoperceiveobjects.Intheeraofrapidproliferationofimagedata,theabilityofcomputerstoautomaticallyrecognizeobjectsinimageswillgreatlyimprovepeople'sworkefficiencyinprocessingimages,excavatingimag
8、es,andmanagingimages,andthushasahugeapplicationprospect.Theappearanceofthedepthsensorenablesanewgenerationofca
此文档下载收益归作者所有