欢迎来到天天文库
浏览记录
ID:28025285
大小:352.54 KB
页数:5页
时间:2018-12-07
《基于多尺度稀疏表示的场景分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第29卷第1期2012年1期计算机应用研究ApplicationResearchofComputers基于多尺度稀疏表示的场景分类段菲,章毓晋(清华大学电子工程系,北京市100084)摘要:捉出一种基于多尺度稀疏表示的场景分类框架。首先从图像中提取多个尺度的局部特征,然后利用稀疏編码为每个尺度的特征单独学习相应的过完备字典;在图像表示阶段,为图像各尺度上的局部特征依据与其对应尺度的字典进行編码,并按照空间金字塔表示方法和特征各维最大汇总(maxpooling)对各尺度上的特征編码分别汇总,最后将不同尺度上汇总的特征串接,形成对图像最终描述的全局向量。在三个常用标准场景库上的分类结果表明
2、,提出的算法由于利用了不同尺度特征间的互补关系,与采用单尺度特征的方法相比,性能有了显著提升。关键词:稀疏表示;多尺度;场景分类;空间金字塔表示中图分类号:TP391.4文献标志码:A文章编号:(作者可不填)doi:10.3969/j.issn.1001-3695(作者可不填)Multi-scalesparserepresentationbasedscenecategorizationDUANFei,ZHANGYujin(DepartmentofElectronicEngineeringTsin^huaUniversity,BeijingJ000849China)Abstract:Th
3、ispaperproposesanovelmulti-scalesparserepresentationbasedframeworkofscenecategorization.Firstly,localfeaturesofmultiplescalesarcextracted,thendictionariesofeachscalearclearnedbyusingsparsecodingalgorithm;inthestageofimagerepresentation,thepaperproposestoencodeeachlocalfeatureaccordingtodictionar
4、yonthesamescale.Byusingspatialpyramidrepresentationandfeaturemax-pooling,thefeaturesoneachscalearesummarized.Inthefinalstep,theproposedalgorithmconcatenatesthepooledfeaturesofdifferentscalestoformtheholisticfeature.Theexperimentalresultsonthreepopularbenchmarkdatasetsshowthatsincetheproposedmeth
5、odutilizethecomplementaryrelationshipoffeaturesondifferentscales,betterperformanceisobtainedcomparedwithmethodsusingfeaturesonsinglescale.Keywords:sparserepresentation;multi-scale;scenecategorization;spatialpyramidrepresentation收稿F期:2012-03-12;修回円期:基金项目:国家0然科学难金项H(61171118)作者简介:段罪(1979-),男(汉族),山
6、两人.博士研宄主,主耍研%方向力阁像处理、机器学习(duanf@163.com):牵毓昔(1954-),男,博士,教授,主耍科学研究领域为孩•积极侣导的图象工程(图象处理、图象分析、图象理解及典技术应用)和相关学科.近年來,词袋模型111(Bag-of-Word,BoW)在场彔分类屮获得Y广泛应用。该模型由局部特征提取、字典学习、特征编码(或称向量量化)、特征汇总四个环节构成,首先从图像屮抽取若干局部特征,然后将这些局部特征进行聚类(通常为K-Means)而形成视觉字典;在表示图像时,则依据扱近邻匹配准则述立图像W部特征到视觉词汇表巾何条的映射,也称向飛?:化(vectorquanti
7、zation,VQ);最后统计出整幅图像中所有视觉词汇的出现频率直方图(通常称之为特征平均汇总(averagepooling)),作为IS终的图像表示。可以看出,传统的词袋校型并未对图像中局部特征之间的位罝关系予以考虑,这显然会制约其描述能力。针对该问题,Lazebnik等121提出空间金字塔表示模型(SPM,spatialpyramidmatching),在特征汇总阶段对传统列袋模型进行了扩展,极大地提升了词袋校型的性能。除缺乏对空间信息的刻
此文档下载收益归作者所有