基于稀疏编码的图像自动标注

基于稀疏编码的图像自动标注

ID:21509314

大小:27.50 KB

页数:7页

时间:2018-10-22

基于稀疏编码的图像自动标注_第1页
基于稀疏编码的图像自动标注_第2页
基于稀疏编码的图像自动标注_第3页
基于稀疏编码的图像自动标注_第4页
基于稀疏编码的图像自动标注_第5页
资源描述:

《基于稀疏编码的图像自动标注》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于稀疏编码的图像自动标注  摘要对于图像的自动标注,探索合适的方法能提高系统标注结果在语义范畴的正确性。该文探讨了基于稀疏编码的图像自动标注。结合近邻及统计的思想,以corel-5k原有人工标注为基础,在matlab平台上对其测试图集进行自动标注。从结果上看,稀疏编码方法准确率相比常用方法偏低,但对于图像特征的学习明显优于其他方法。因此,稀疏编码在图像的自动标注领域有可行之处。  【关键词】稀疏编码图像自动标注近邻求解  1引言  图像自动标注是通过获得已经标注好的图像集,对未标注过的图像进行标注。近年来,对图像自动标注的研究增多

2、,使准确率逐渐提高。图像自动标注使用最广泛的是基于学习方法的分类模型,例如判别式模型、生成模型等。此外,还有一种基于最近邻的分类模型。因为最近邻的标注方法使用的视觉特征不能很好的反映语义信息,所以应用并不普遍。但在视觉特征的提取和近邻图像求解方法进行改进,就可以提高近邻模型的标注性能。基于稀疏编码的图像自动标注就是一种基于最近邻的分类模型。  2最近邻方法论证  2.1图像特征提取  最常用的图像特征是颜色特征,除此之外还有纹理特征、形状特征、空间特征等特征。一般特征的提取有很多方式。颜色特征、sift特征、freak特征、bris

3、k特征等等。因为颜色空间的HSV特征结果便于后续的视觉分析且计算量小,本文只考虑图像颜色特征的提取。  2.2最近邻求解  最近邻图像求解是图像自动标注最重要的部分,其核心是通过对提取的图像特征运算得到与其最相似的图像。最近邻图像求解算法很多,本文只在最常用的欧式距离和最终使用的稀疏编码之间展开讨论。  2.2.1欧式距离算法  欧式距离算法很早就在图像边缘检测、人脸识别、数据审计等不同方向有着广泛的应用。对于相似性度量,欧式距离是一个简单实用的算法。在寻找相似的图像中,为了提高准确性,提取的图像特征不一定只有颜色特征一种。但考虑到

4、不同特征的影响不同,这里引进一种加权的欧式距离算法:  2.2.2稀疏编码算法  稀疏编码源自于神经网络,是近年来图像信号处理领域的一个研究热点。其最大的优势是压缩数据量,给在高纬度数据的计算带来极大便利。例如两个上万纬的向量空间,一个作为训练空间一个作为测试空间。两个空间做一个简单的内积可能达上万次。但如果这两个向量空间里有n个和m个非零元素,那么只用做min(n,m)次乘法。并且当m,n远大于零元素的个数时,计算量就会大大减少。但并不是min(n,m)越小越好,对于训练空间,若n的值远远小于空间纬度值,即数据点个数远小于特征数量

5、,并且这时候还没有任何约束,便会出现过拟合的情况。过拟合不是没能拟合好训练数据,相反,过拟合的代价反而与零非常相近,这样则会导致训练结果没法泛化到测试样本空间中去。要是因为特征过多发生了过拟合,减少不必要的特征量便能减少过拟合。但很多时候,其特征不仅庞大还没有冗余,所以一般都用正则化在保留所有特征变量的情况下减少其数量级。正则化可以通过坐标下降法和范数求解等方法实现。这些方法,最常用的l1范数正则化。l1范数是从凸优化角度计算训练空间的稀疏系数,是l0范数的最优凸近似,又比l2更具有稀疏性。因此,本文采用l1正则最小二乘法求解测试目

6、标与训练空间对应的稀疏系数。  式中y为测试图像特征,A是所有训练图像特征构成的矩阵,x为稀疏的基向量。λ∑xi是正则化项,λ是正则化参数。正则化项能对高阶项进行收缩,通过在很好的拟合数据和保持参数值较小之间找到平衡。λ越大拟合的结果越简洁,若过大,则拟合的结果将会趋近一条水平线,此时为欠拟合。  综上所述,欧式距离算法虽然相对简单,但其图像所有特征点同等对待,这大大减少了图像之间的关联性同时也失去部分图像信息。而稀疏编码算法不仅能考虑图像的关联性和差异性,同时也是一种鲁棒性很强的算法。因此,本文最终使用稀疏编码方法在图像的hsv颜

7、色特征上对图像进行自动标注。  3实验思路  Corel-5k数据集图像集共包含大小相等的5000张图片。Corel-5k分为50个大类,每一类都是100张图,且每一类都有相应主题。其中每张图片已被人工标注了1~5个单词。  本实验先提取数据集里所有图片合适的图像特征和人工标注的关键词作为训练图集数据,然后采用相应的算法求解测试图集各幅图对训练图集最近邻的k幅图片,最后统计这些图片中出现次数前n个的标注作为训练图片的自动标注结果。  程序首先对corel-5k数据集所有图像进行HSV颜色特征的提取,将训练图像组成一个矩阵,测试图像组

8、成另一个矩阵。一次对测试图像求解相对训练图像的稀疏系数。求解l1范数引用了[8]M.Figueiredo,R.Nowak,andS.Wright的梯度投影法。取出前五个稀疏系数最小的图像,再统计前五个出现次数最多的人工标注的词作为自动

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。