欢迎来到天天文库
浏览记录
ID:27720219
大小:332.00 KB
页数:4页
时间:2018-12-05
《基于隐含狄利克雷分配模型的图像分类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第38卷第14期Vol.38No.14计算机工程ComputerEngineering2012年7月July2012·图形图像处理·文章编号:1000—3428(2012)14—0181—03文献标识码:A中图分类号:TP341.94基于隐含狄利克雷分配模型的图像分类算法杨赛,赵春霞(南京理工大学计算机科学与技术学院,南京210094)摘要:概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对图像进
2、行分类。实验结果表明,与基于概率隐含语义分析模型的分类算法相比,该算法的分类性能较优。关键词:BOF模型;中层语义特征;隐含狄利克雷分配模型;隐含主题分布特征;k近邻算法;图像分类ImageClassificationAlgorithmBasedonLatentDirichletAllocationModelYANGSai,ZHAOChun-xia(SchoolofComputerScienceandTechnology,NanjingUniversityofScienceandTechnology,Nanjing210094,China)【Abstract】Tosolvethep
3、roblemthatprobabilisticLatentSemanticAnalysis(pLSA)modelisnotsuitableforlarge-scaleimagedataset,anewimageclassificationalgorithmbasedonLatentDirichletAllocation(LDA)modelisproposed.ItusesBag-of-Features(BOF)modelasimagesinitialdescription,appliesGibbssamplingtoestimatetheparametersofLDAmodel,a
4、ndgetsimagesdistributioninthelatenttopicspace.ImagesarefinallyclassifiedbykNearestNeighbor(kNN)algorithm.Experimentalresultsindicatethat,comparedwithalgorithmbasedonpLSAmodel,theimageclassificationalgorithmbasedonLDAhasmorepowerfulclassificationperformances.【Keywords】Bag-of-Features(BOF)model;
5、middle-levelsemanticfeature;LatentDirichletAllocation(LDA)model;latenttopicdistributionfeature;kNearestNeighbor(kNN)algorithm;imageclassificationDOI:10.3969/j.issn.1000-3428.2012.14.0541概述BOF(Bag-of-Features)模型是当前流行的图像表示方法,增多而线性增长,不适合应用于大规模图像数据集。与pLSA模型相比,隐含狄利克雷分配(LatentDirichletAllocation,LDA
6、)模型是一种完全的生成模型,该模型将主题混合权重视它借用一个视觉词典间接表示特征矢量集合,将每幅图像表示为视觉单词的发生频率的直方图,本质上是一种中层语义特征表示方法,缩小了底层视觉特征与高层语义特征之间的为T维参数的潜在随机变量,而非与训练数据直接联系的个体参数集合,克服了pLSA模型的不足[7]。本文介绍的图像“语义鸿沟”[1]。分类算法以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,从而获取图像的隐含主题 研究者对如何进一步提高BOF模型的中层语义特征表分布特征,并采用k近邻算法在主题空间中对图像进行分类。 征性能进行了研究。文献[2]构建B
7、OF特征如下:(1)对图像中的每个局部特征描述矢量对照视觉词典进行编码的过程,常用方法是硬分配方法;(2)对变换后的矢量进行统计,常用2BOF模型BOF模型算法[8]的主要步骤如下:方法是平均值统计方法。文献[3]为了减少矢量量化过程的损(1)局部特征提取及其描述。使用局部信息对图像建立特失,放宽了编码过程中的约束条件,在优化目标中添加稀疏征描述,最直接的方法是利用各种兴趣点检测算子或者区域正则项,提出了非线性变换的稀疏编码算法。文献[4]采用最检测算子获得局部特征区
此文档下载收益归作者所有