基于多尺度稀疏表示的场景分类

基于多尺度稀疏表示的场景分类

ID:28025285

大小:352.54 KB

页数:5页

时间:2018-12-07

基于多尺度稀疏表示的场景分类_第1页
基于多尺度稀疏表示的场景分类_第2页
基于多尺度稀疏表示的场景分类_第3页
基于多尺度稀疏表示的场景分类_第4页
基于多尺度稀疏表示的场景分类_第5页
资源描述:

《基于多尺度稀疏表示的场景分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第29卷第1期2012年1期计算机应用研究ApplicationResearchofComputers基于多尺度稀疏表示的场景分类段菲,章毓晋(清华大学电子工程系,北京市100084)摘要:捉出一种基于多尺度稀疏表示的场景分类框架。首先从图像中提取多个尺度的局部特征,然后利用稀疏編码为每个尺度的特征单独学习相应的过完备字典;在图像表示阶段,为图像各尺度上的局部特征依据与其对应尺度的字典进行編码,并按照空间金字塔表示方法和特征各维最大汇总(maxpooling)对各尺度上的特征編码分别汇总,最后将不同尺度上汇总的特征串接,形成对图像最终描述的全局向量。在三个常用标准场景库上的分类结果表明

2、,提出的算法由于利用了不同尺度特征间的互补关系,与采用单尺度特征的方法相比,性能有了显著提升。关键词:稀疏表示;多尺度;场景分类;空间金字塔表示中图分类号:TP391.4文献标志码:A文章编号:(作者可不填)doi:10.3969/j.issn.1001-3695(作者可不填)Multi-scalesparserepresentationbasedscenecategorizationDUANFei,ZHANGYujin(DepartmentofElectronicEngineeringTsin^huaUniversity,BeijingJ000849China)Abstract:Th

3、ispaperproposesanovelmulti-scalesparserepresentationbasedframeworkofscenecategorization.Firstly,localfeaturesofmultiplescalesarcextracted,thendictionariesofeachscalearclearnedbyusingsparsecodingalgorithm;inthestageofimagerepresentation,thepaperproposestoencodeeachlocalfeatureaccordingtodictionar

4、yonthesamescale.Byusingspatialpyramidrepresentationandfeaturemax-pooling,thefeaturesoneachscalearesummarized.Inthefinalstep,theproposedalgorithmconcatenatesthepooledfeaturesofdifferentscalestoformtheholisticfeature.Theexperimentalresultsonthreepopularbenchmarkdatasetsshowthatsincetheproposedmeth

5、odutilizethecomplementaryrelationshipoffeaturesondifferentscales,betterperformanceisobtainedcomparedwithmethodsusingfeaturesonsinglescale.Keywords:sparserepresentation;multi-scale;scenecategorization;spatialpyramidrepresentation收稿F期:2012-03-12;修回円期:基金项目:国家0然科学难金项H(61171118)作者简介:段罪(1979-),男(汉族),山

6、两人.博士研宄主,主耍研%方向力阁像处理、机器学习(duanf@163.com):牵毓昔(1954-),男,博士,教授,主耍科学研究领域为孩•积极侣导的图象工程(图象处理、图象分析、图象理解及典技术应用)和相关学科.近年來,词袋模型111(Bag-of-Word,BoW)在场彔分类屮获得Y广泛应用。该模型由局部特征提取、字典学习、特征编码(或称向量量化)、特征汇总四个环节构成,首先从图像屮抽取若干局部特征,然后将这些局部特征进行聚类(通常为K-Means)而形成视觉字典;在表示图像时,则依据扱近邻匹配准则述立图像W部特征到视觉词汇表巾何条的映射,也称向飛?:化(vectorquanti

7、zation,VQ);最后统计出整幅图像中所有视觉词汇的出现频率直方图(通常称之为特征平均汇总(averagepooling)),作为IS终的图像表示。可以看出,传统的词袋校型并未对图像中局部特征之间的位罝关系予以考虑,这显然会制约其描述能力。针对该问题,Lazebnik等121提出空间金字塔表示模型(SPM,spatialpyramidmatching),在特征汇总阶段对传统列袋模型进行了扩展,极大地提升了词袋校型的性能。除缺乏对空间信息的刻

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。