资源描述:
《图像论文:基于多特征集成图像自动标注方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、图像论文:基于多特征集成的图像自动标注方法研究【中文摘要】随着数码设备和计算机网络的发展及广泛应用,数字图像在计算机中的存储量呈爆炸式的增长。为了实现计算机对海量图像的自动管理,图像检索特别是图像自动标注成为近年来研究的重点和热点。针对图像的多标注问题和“语义鸿沟”问题,本文研究使用多特征集成的图像自动标注方法,以进一步提高图像自动标注的性能。本文的主要研究内容和创新点如下:(1)为解决传统图像标注中标注词与图像区域之间缺乏对应关系的问题,本文在对未标注图像进行标注之前,引入分割算法将图像划分成若干个图像区域,并对每个图像区域分别进行图像自动标注的策略
2、,使图像区域与标注词之间建立起一一对应的关系。(2)鉴于目前图像自动标注中只有少量已标注样本的实际情况,本文采用半监督学习方法思想来建立标注模型。该方法同时将已标注样本和未标注样本用于机器学习中,并利用图像底层视觉特征空间的分布信息,来度量未标注图像到各标注词之间的视觉特征距离,从而为未标注图像选择标注关键词。(3)针对图像自动标注系统多采用单个分类器,从而导致标注准确率较低问题,本文研究并提出基于多特征集成的图像自动标注算法EMDAIA。该算法将图像自动标注问题看作是图像的多分类问题,构造并集合多个分类器的分类结果,选择出现概率最大的预测词来对图像进
3、行标注。EMDAIA使用LabelMe图像数据库进行实验,实验结果表明,EMDAIA比仅使用单一特征进行图像自动标注的准确率提高了约10%。(4)研究并提出一种基于感兴趣区域的图像自动标注方法ROIAIA,该方法在对未标注图像进行标注前,先采用Itti模型提取图像的感兴趣区域,然后对提取的感兴趣区域进行标注。实验表明,基于感兴趣区域的图像自动标注能有效地减少图像次要区域对主要区域的影响,将图像自动标注的注意力集中到用户感兴趣的图像区域。(5)研究了特征子集的选择对图像自动标注性能的影响,对提取的10种视觉特征选择后组合成10个不同的特征子集,在PASC
4、ALVOC2008图像数据库上进行实验,结果表明:使用多特征集成可以提高分类器的分类性能,8种视觉特征构造特征子集时图像标注的平均准确率最高,继续增加特征的种类反而会降低标注结果的准确率。【英文摘要】Withthedevelopmentofdigitalequipmentandcomputernetwork,thenumberofdigitalimagesisgrowingdramatically.Inordertomanagethelargevolumesofdigitalimagesautomatically,variousimageretriev
5、altechniques,especiallyimageautomaticallyannotationalgorithms,drawalotofattentionsinrecentyears.Aimingathandlingtheproblemofmultipleannotationsand“semanticgap”ofimages,thispaperinvestigateshowtoutilizemultiplevisualdescriptorstoimprovetheperformanceofautomaticallyimageannotation
6、.Themajorcontentsandcontributionsofthispaperare:(1)Inordertocopewiththeproblemoflackinglinkagesbetweenimagesregionsandlabelkeywords,thispaperemploysaNormalizedCutsalgorithmtosegmenteachimageintoimageregionsbeforeannotation,andthenusesanimageannotationstrategyoneachimageregionres
7、pectively,soastocreateone-VS-onelinkagesbetweenimageregionsandlabelkeywords.(2)Ascurrentlyonlylimitedlabeledsamplesareavailablewhilealargeamountofunlabeledsamplesexistinagivenimageannotationsystem,thispaperadoptstheideaofsemi-supervisedlearningtoconstructlearningmodels.Themodelu
8、tilizesbothlabeledandunlabeledsamplesfortrainin