基于几何流形熵的图片分类方法研究

基于几何流形熵的图片分类方法研究

ID:30994216

大小:66.00 KB

页数:4页

时间:2019-01-05

基于几何流形熵的图片分类方法研究_第1页
基于几何流形熵的图片分类方法研究_第2页
基于几何流形熵的图片分类方法研究_第3页
基于几何流形熵的图片分类方法研究_第4页
资源描述:

《基于几何流形熵的图片分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于几何流形爛的图片分类方法研究摘要:本文提出了一种新颖的基于几何语义的爛描述符算法。借助爛描述符,可以更好的构造用于图片分类的爛环。通过最小化嫡值获得最优环,此时图片将按语义顺序连接。图片分类过程分为训练和预测,训练步骤搜索各类别的最优坏,在预测步骤中,如果某图片插入某个环中,相对于其他类别环产生最小的爛增量,则该图片属于该环所属的分类。通过研究发现,该方法对于很难分类的容易混淆的图片集仍能产生非常好的效果,但是各类图片须是同一个对象的多视角投影。实验结果表明,该炳描述符方法在该类图片分类过程中具

2、有很优异的性能。关键词:图片分类;儿何流形爛;最优环;禁忌搜索中图分类号O1文献标识码a文章编号1674-6708(2011)53-0089-010引言图片分类即基于图片内容对图片进行分类。过去的很多论文都是基于支持向量机(svm)构建分类器[1],并取得了一定的成果。但是,耍获得很高的图片分类正确率以及稳定性仍具有相当大的挑战。这部分是因为语义相关的图片可能并不是一个线性超平面的特征空间。本文着重探讨这个问题,并提出了一个新颖的基于炳描述符的图片分类算法。文中提出的爛用來描述表示儿何特征的流形特征

3、。通过最小化爛值,将图片数据组织为一个语义连续的环。优化的环实际上为训练图像建立了一个数学模型,而这些模型可用來决定测试图像的分类标签。该分类策略为:首先搜索该测试图像在每个环中最优或算法所能达到的最优位置。对于每个环,测试图像会插入使嫡增加最小的位置,再通过比较所有环的爛增量,测试图片会添加到嫡值增加最小的坏所代表的分组即分类中。在本文的研究中,釆用禁忌搜索方法[2]求解该优化问题。1爛描述符图片的语义表示是图片分类方法成功的关键。本文的研究中,我们应用几何流形爛(geomen)描述特征空间屮得图

4、片的语义相似性。具体而言,给定一个图片特征向量的集合。我们首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序o可以描述为:,其中每一项对应向量的索引。这样集合x的在顺序o下的geomen值为环上各点炳值的平均值。即:(1)且各s(x,o,i)为两分量加权和:空间分量P(x,o,i)和几何分量g(X,o,i)如下:(2)上式a是用来修正空间分量对geomen的贡献大小。geomen表征按照顺序0连接的环的平滑程度。另外,它也是在数据近似性的量度。因为图片排序可以

5、被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上geomen的表示。geomen的空间分量用欧拉距离量度,其中,与为环()中得相邻项。几何分量由两部分组成:曲线曲率k和止则项。即:(3)引入正则项可以修正噪声对曲率的彩响。2图片分类的算法框架因为如果两个类别有一个明显的区别,那么在边界点处爛值便会极大的增加。这个启发我们对一个点的错误分类将会导致该类最优环炳值的急剧增加。反之,如果一个点正确分组进入一个类,该类的最优环的爛值将只会增加一点点。这正是本文基于炳描述符的图

6、片分类算法基木框架的基木思想。因此每个类首先都需要通过训练获得一个最优环即该类别的模型。这样对于待预测图片,通过比较其插入每个故优环的爛增即可获得该图片的分类标签。这样,为了找到最优环,我们需要最小化geomen值,亦即:。在该研究中,我们估计通过简单的禁忌搜索算法获得爛的全局最小值。关于禁忌搜索算法可以参看文献[2]。每个类的最优环实际上训练图片的提取模型。该模型可用于获取测试未知图片的类别标签。分类的策略为在所有环中找到图片q的最优位置。测试图片的类别即位最优位置所在环的类别。3实验木实验采用p

7、hog[3]作为特征描述符。实验针对对三个数据集进行了测试:umist人脸数据集,以及自制的背景杂乱的汽车数据集,E机模型数据集。匕机模型数据集通过使用3dmax软件对各种飞机模型进行旋转,并选取角度渲染投影成二维照片获得。同时,我们基于svni的分类器与之相比较。4结论由表1可知,我们的算法框架具有更好的性能,更高的正确率以及可靠性。人脸数据集表明我们的算法框架中在人脸分析中具有很好的分类性能。同时,汽车数据集尽管背景杂乱,但仍具有较高止确率,更比svm高出22.50%,表明该框架对背景的高稳定性

8、。同时,对于飞机模型优异表现,表明该算法框架对于基于图片的模型检索的重大应用潜力。总之,该算法无论对于多视角图片集中,不管背景杂乱与否,总能表现岀优秀的分类正确率和健壮性。表1实验结杲对照表参考文献[1]x・li,1.wangande・sung”multilabelsvmactive1earningforimageclassification,proc・icip,p.2207,2004.[2]c.zhang,h・li,q.guo,j.jia,andi.-f.shen・

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。