金字塔匹配核:用图像特征集的判别分类

金字塔匹配核:用图像特征集的判别分类

ID:40509511

大小:156.97 KB

页数:8页

时间:2019-08-03

金字塔匹配核:用图像特征集的判别分类_第1页
金字塔匹配核:用图像特征集的判别分类_第2页
金字塔匹配核:用图像特征集的判别分类_第3页
金字塔匹配核:用图像特征集的判别分类_第4页
金字塔匹配核:用图像特征集的判别分类_第5页
资源描述:

《金字塔匹配核:用图像特征集的判别分类》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、金字塔匹配核:用图像特征集的判别分类KristenGraumanandTrevorDarrell2005年摘要判别学习是具有挑战性的,当实例是特征集,且这些集合的基数是变化的并缺乏任何有意义的排序。基于内核的分类方法可以学习复杂的决策边界,但当输入是无序集时内核必须以某种方式解决对应关系——通常一个计算昂贵的任务对大型数据集来说变得不切实际。我们提出了一个新的快速核函数——将无序的特征集映射到多分辨率直方图,并在这个空间计算加权直方图交叉核。这种“金字塔匹配”的计算量与特征的数量是成线性关系的,它基于匹配首次出现的最精细分辨率的单元格隐式地找到

2、对应关系。因为内核并没有penalize(惩罚,使处于不利地位)额外特征的存在,它对杂波具有鲁棒性。我们展示核函数是正定的,这使其在最优解决方案只能保证Mercer内核的学习算法中的应用是有效的。我们在目标识别任务中验证了我们的算法,并证明它是准确的比当前的一些方法更快。1.引言用于计算机视觉的各种表示包括无序的特征集或部分集,其中每个集合有不同的基数,并在每个集合中的特征之间的对应关系是未知的。例如,一个图像可能由一组检测到的局部仿射不变区域描述,一个形状可以由一组定义在每个边缘点的局部描述符描述,或一个人的脸可以由一组不同的面部部分块表示。

3、在这种情况下,特征向量集代表一个特定感兴趣类别(对象,场景,形状,人脸等)的单一实例,并且人们期望特征的数目在不同的例子——由于视点变化,闭塞,或由兴趣算子的不一致检测——中是不同的。用这种表示来执行如分类或识别这样的学习任务是具有挑战性的。虽然生成方法已经取得了一些成功,但基于内核的识别方法以有效地表示复杂的决策边界和概括(generalizewell)未知数据[24,21]而著称。例如,支持向量机(SVM)是一种广泛使用的找出两类之间的最佳分离超平面的判别分类方法。核函数,衡量输入数据的相似性,向决策功能引入了非线性;内核非线性地将输入空间

4、的两个实例映射到特征空间中的内积。然而,传统的基于核的算法被设计为固定长度的向量输入操作,其中每个输入向量对应于该实例的一个特定的全局属性;定义在的常用的通用内核(例如,高斯RBF,polynomial(多项式))不适用于向量空间。图1.金字塔匹配核交叉直方图成金字塔状形成的局部特征,近似于特征集之间的最佳匹配。在这项工作中,我们提出了一个金字塔匹配核——定义在无序特征集合上的允许它们被有效并高效地应用在基于核的学习方法中的新的核函数。每一个特征集被映射到一个在最精细水平保留单个特征的特性的多分辨率直方图上。然后使用加权直方图相交计算来比较直方

5、图金字塔,我们显示了在匹配对第一次出现的最精细分辨率的直方图单元里定义的隐式的对应关系(见图1)。通过金字塔匹配度量的相似性近似于不平等基数(unequalcardinality)的特征集之间的最佳对应度量的相似性(即,在较低的基数集合中的最佳匹配点的部分匹配近似于较大的基数集合中的点的一些子集,这样匹配点之间的总的相似性是最大的)。我们的核是非常有效的并且可以在与集合的基数成线性的时间内被计算。我们证明了我们的核函数是正定的,这意味着它适合于与保证只为正定核收敛到一种独特的优化(例如,支持向量机)的学习方法一起使用。因为它不penalize多

6、余数据点的存在,我们所提出的核对杂波是鲁棒的。我们将表明,这转化为用不同背景或遮挡来处理未分割图像的能力。核还respect输入集所固有的共生关系:代替单独的集合中的匹配功能,忽略一个集合中由特征所传达的潜在的依赖关系,我们的相似性度量捕捉特征的联合统计。解决这个问题的其他方法已被提出[25,3,12,27,16,20,14],但不幸的是,这些方法中的每一个都有以下缺点中的某一些:计算复杂度使大型特征集不可行;参数分布的限制可能无法充分描述数据;非正定(不保证对支持向量机唯一的解决方案)的内核;相同大小集合的限制;和不考虑特征集内的依赖关系。我

7、们的方法解决了所有这些问题,产生了适用于在已经存在的任何基于核的学习范式中比较无序的,长度可变的特征集合的核。我们用目标识别任务证明了我们的算法,并显示其准确性比得上当前的方法,然而需要显著较少的计算时间。2.相关工作在本节中,我们将回顾基于特征集合的判别式分类的相关工作,采用内核和支持向量机进行识别及多分辨率图像表示。目标识别是一个具有挑战性的问题,需要来自一个分类器的强大的推广能力,以应对同一对象或对象类的图片的各种各样的光照,视角,闭塞,杂乱,类内外形和变形的发生。虽然研究者已显示出将支持向量机用于目标识别的有希望的结果,但他们通常使用全

8、局图像特征——将图像作为一个整体的长度相等的特征,例如颜色或灰度直方图或原始像素数据的向量[5,1,17]。众所周知,这种全局表示对真实世界的成像条件

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。