欢迎来到天天文库
浏览记录
ID:55976590
大小:5.56 MB
页数:7页
时间:2020-03-23
《一种多尺度时频纹理特征融合的场景分类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第37卷第10期仪器仪表学报Vol37No102016年10月ChineseJournalofScientificInstrumentOct.2016一种多尺度时频纹理特征融合的场景分类算法史静,朱虹,邢楠,韩勇,杜森(西安理工大学自动化与信息工程学院西安710048)摘要:场景分类目前是机器视觉领域的一个研究热点,为了解决该研究领域中分类特征的提取问题,提出了一种多尺度纹理描述子(MSTD)特征。首先,采用小波变换,获得图像在时频域上的多尺度纹理视觉全局特征信息,之后提取反映局部细节的局部二值模式(LBP)特征,在时频域上进行融合,生成多尺度纹理描述子特征
2、,以此作为图像分类的依据,最后采用支持向量机(SVM)作为分类器进行场景分类。在4个标准数据集上进行测试,实验结果表明,该方法具有较高的分类正确率,对室外场景的分类正确率都在84%以上。所提出的分类方法充分考虑了全局特征和尺度信息,增强了单层特征的区分度,有效地改善了分类的精度。关键词:场景分类;多尺度;纹理特征;多尺度纹理描述子中图分类号:TP391.4TH79文献标识码:A国家标准学科分类代码:520.20MultiscaletimefrequencytexturefeaturefusionalgorithmforsceneclassificationSh
3、iJing,ZhuHong,XingNan,HanYong,DuSen(SchoolofAutomationandInformationEngineering,Xi′anUniversityofTechnology,Xi′an710048,China)Abstract:Sceneclassificationiscurrentlyahottopicinthefieldofmachinevision.Inordertosolvetheproblemofclassificationfeatureextraction,amultiscaletexturedescript
4、or(MultiscaleTextureDescriptor,MSTD)characteristicispresented.Firstly,thewavelettransformisusedtoobtainamultiscaleglobalvisualtexturefeatureinformationinthetimefrequencydomain.TheLBPfeaturereflectinglocaldetailsandfusinginthetimefrequencydomainisextractedtogeneratemultiscaletextu
5、redescriptorsfeatures.ThefinalSVMisusedasaclassifiertoclassifythescene.Basedonfourstandarddatasets,experimentalresultsshowthatthepresentedmethodhashigherclassificationaccuracy,andtheoutdoorsceneclassificationaccuracyrateisabove84%.Theproposedclassificationmethodtakesintoaccounttheglob
6、alfeaturesandscaleinformationtoenhancethediscriminationofsinglecharacteristics,whicheffectivelyimprovestheaccuracyoftheclassification.Keywords:sceneclassification;multiscale;texturefeature;multiscaletexturedescriptors(MSTD)特征表示着手,包括图像的纹理、颜色和形状等。Vailaya[7]1引言A等人提取图像的边缘方向一致性矢量和空间颜色矩描述
7、场景内容,训练二类贝叶斯分类器进行场景分类;[8]图像的场景分类问题,实际上是利用计算机模拟人SzummerM等人提取图像中子块的颜色、纹理和频率[9]类的视觉感知原理,对包含若干语义信息的场景图像实特征,来作为场景特征;BenmokhtarR等人融合图像的现自动标注,它为实现合理、有效地管理海量图像数据奠纹理和颜色特征实现足球场景的分类。这些方法仅利用定了坚实的基础,它也成为了近年来计算机视觉研究领全局特征进行分类,其区分力有限。[16]域的关键问题之一。近年来,视觉词典模型(bagofvisualwords,BoVW)[1016]早期的场景图像分类方法大都
8、是从图像全
此文档下载收益归作者所有