欢迎来到天天文库
浏览记录
ID:55690912
大小:28.00 KB
页数:14页
时间:2020-05-25
《基于深度学习的RGB�D物体识别算法.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于深度学习的RGB―D物体识别算法 【摘要】本文结合RGB图像和深度图像,提出了一种新的基于深度学习的无监督物体识别算法KSAE-SPMP。采用标准的RGB-D数据库2D3D来验证新提出的算法。实验结果表明,与之前提出的基于RGB-D的物体识别算法相比,KSAE-SPMP算法取得了最高的识别准确率,此算法能够很好地完成RGB-D物体的识别。 【关键词】物体识别RGB-D图像k稀疏自编码空间金字塔最大池化Softmax分类器 doi:10.3969/j.issn.1006-1010.2015.10.000中图分类号:TP391.4文献标识码:A文章编号
2、:1006-1010(2015)10-0000-00 [Abstract]CombinedwithRGBanddepthimages,anovelunsupervisedobjectrecognitionalgorithmKSAE-SPMPbasedondeeplearningwasputforward.AstandardRGB-Ddatabase2D3Dwasadoptedtoverifytheproposedalgorithm.ExperimentalresultsdemonstratedthatcomparedwithRGB-Dalgorithmba
3、sedonobjectrecognitionproposedpreviously,KSAE-SPMPalgorithmhasthehighestaccurateidentificationrate,whichisabletocompletetheRGB-Dobjectrecognitioncommendably. [KeyWords]objectrecognitionRGB-DimageKsparseautoencodingspatialpyramidmaxpoolingSoftmaxclassifier 1引言 基于RGB图像的物体识别从RGB图像中
4、提取颜色特征、纹理特征和轮廓特征等来识别物体。基于深度图像的物体识别从深度图像中提取物体的三维空间形状等特征来识别物体。这2种物体识别方法都未能完全利用物体的可用特征信息,存在一定的局限性。RGB-D相机能同时记录物体的高分辨率的RGB图像和深度图像。物体的深度信息和颜色信息对彼此都是一种有效的补充,结合RGB图像和深度图像,能够有效地提高物体的识别准确率。 深度学习[1]是一种新兴的多层神经网络学习算法。它通过组合低层特征形成更加抽象的高层表示,以发现数据的分布式特征表示。本文结合RGB图像和深度图像,提出了一种新的深度学习算法KSAE-SPMP来完成物
5、体的识别。实验结果表明,与之前提出的基于RGB-D的物体识别算法相比,KSAE-SPMP算法取得了最高的识别准确率,此算法能够很好地完成RGB-D物体的识别。 2相关的研究工作 本文主要研究如何利用深度学习算法完成RGB-D的物体识别。在过去的几年中,一些研究小组对如何从物体中无监督地提取具有代表性的特征做了深入的研究,取得了一些极具价值的研究成果。 (1)无监督特征学习算法 近年来,许多无监督的从原始视觉图像中提取特征的算法被提出。例如深度信念网络[4]、去噪自编码[5]、卷积神经网络[6]、K均值算法[7-8]、分层稀疏编码[9]和分层匹配追踪算
6、法[3]等。这些无监督的特征学习算法在多种识别工作中取得了优异的成果。如手写字体的识别、面部识别、物体识别、场景识别、动作识别[15]和物体识别[16]等。然而,这些算法大多被应用在二维图像的处理上,如灰度图像。本文同时使用RGB和深度图像,提取到了更多样性的特征,有效地提高了物体的识别准确率。 (2)基于RGB-D的深度学习算法 新一代传感技术RGB-D相机的出现,推动了物体识别技术的进一步发展。RGB-D相机能够同时记录RGB图像和深度图像,RGB图像包含物体的表面颜色信息和纹理信息,深度图像包含物体的空间形状信息,结合RGB图像和深度图像能有效地提
7、高物体的识别准确率。在过去的几年里,许多基于RGB-D的物体识别深度学习算法被提出。Blum等人提出了卷积K均值描述符[7],在兴趣点附近自动地学习特征并最终将这些特征进行融合。LiefengBo等人提出了分层匹配追踪算法(HMP)[10],此算法利用稀疏编码和空间金字塔最大池化(SPMP)无监督地从原始RGB-D图像中学习分层的特征。Socher等人结合卷积神经网络和递归神经网络提出了CNN-RNN深度学习算法[11],卷积神经网络层学习低维的平移不变性特征并作为RNN输入,递归神经网络层学习高维抽象特征。本文在LiefengBo等人工作[10]的基础上,
8、结合改进的k稀疏自编码算法(k-SAE)和空间金字塔
此文档下载收益归作者所有