论文——可视化对象检测

论文——可视化对象检测

ID:29667131

大小:1.98 MB

页数:24页

时间:2018-12-21

论文——可视化对象检测_第1页
论文——可视化对象检测_第2页
论文——可视化对象检测_第3页
论文——可视化对象检测_第4页
论文——可视化对象检测_第5页
资源描述:

《论文——可视化对象检测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、可视化对象检测摘要:我们引入算法来可视化对象检测器使用的特征空间。我们的方法可以将视觉化的特征转化回多幅自然图像。我们发现这些可视化允许我们以新的方式分析对象检测系统,并获得对检测器故障的新见解。例如,当我们对高评分假警报的特征进行可视化时,我们发现,尽管它们在图像空间中显然是错误的,但它们常常看起来与特征空间中的真正性相似。这一结果表明,许多这样的假警报是由我们选择的特征空间造成的,支持创建一个更好的学习算法或构建更大的数据集是不可能纠正这些错误的。通过可视化特征空间,我们可以更直观的了解识别系统。1、介绍图1显示了具有HOG特征的对象检测器和在大数据库的线性SVM分类器的高得分检测图像。

2、为什么我们的探测器认为海水看起来像一辆汽车?图1:来自PASCAL的图像和来自DPM的高分的汽车检测(Felzenszwalb等人,2010b)。为什么检测器出现故障?图2:显示图1中假汽车检测的结果。右边显示了同一个补丁的HOG特征的可视化。可视化显示,这个假警报在HOG空间实际上看起来像一辆汽车。不幸的是,计算机视觉研究人员往往无法解释物体检测系统的故障。一些研究者责怪这种特性,其他研究人员责怪训练方式,甚至更多的抱怨学习算法。然而,如果我们希望建立下一代的对象探测器,它似乎关键是要认识我们当前探测器的失败。在本文中,我们介绍了一个工具来解释一些失败的对象检测系统。我们提出算法来可视化对

3、象检测的特征空间。由于大多数特征空间对于人类直接检查来说尺寸过大,可视化算法通过特征描述反转回自然图像。我们发现这些反演提供了用于对象检测的特征空间的直观的可视化。图2显示了虚拟汽车检测的可视化算法的输出。这种可视化显示,虽然在原始图像中显然没有汽车,但是在HOG描述符中存在汽车隐藏。HOG特征看到与人类看到的视觉世界略有不同,通过可视化这个空间,我们可以更直观地了解我们的对象检测器。图3:可视化来自可形变部分模型(Felzenszwalb等人,2010b)的一些高分检测,用于人、椅子和汽车。你能猜到哪些是假警报?花一分钟研究这个数字,然后参见图23相应的RGB色块。图4:由于有许多图像映射

4、到类似的特征,我们的方法恢复在图像空间不同的多个图像,但在特征空间紧密匹配。图3反转了对PASCAL的更多顶部检测的几个类别,你能猜到哪些是假警报?花一分钟研究这个图像因为接下来可能会破坏惊喜。虽然每个可视化看起来像一个真正的特性,所有这些检测实际上是假警报。因此,即使有更好的学习算法或更多的数据,这些假警报可能会持续。换句话说,这些特性是造成这些故障的原因。本文的主要贡献是用于可视化对象检测中使用的特征的通用算法。我们提出了一种将视觉特征反转回图像的方法,以HOG和CNN中激活的两个标准特征的实验显示对象检测。由于有许多图像可以产生等效的特征描述符,我们的方法还恢复了在图像空间中感知上不同

5、的多个图像,但是映射到类似的特征向量,如图4中所示。本文的其余部分介绍并分析我们的可视化算法。首先回顾一个不断增长的特征可视化工作的手工制作特征和学习表示。我们用自动基准和大型人类研究评估我们的反演,我们发现我们的可视化在表示HOG特征的内容方面比标准方法在感知上更准确;参见图5,用于我们的可视化和HOG字形之间的比较。然后我们使用我们的可视化来检查对象检测系统的行为并分析它们的特征。由于我们希望我们的可视化对其他研究人员有用,我们的最终贡献是公共特征可视化工具箱。1、相关工作可视化算法是特征反演的部分工作。OlivaandTorralba(2001),在早期工作中,描述了一种简单的迭代过程

6、回复给出要点描述符的图像。Weinzaepfel等人(2011)第一次重建图像给定其关键点SIFT描述符(Lowe,1999)。他们使用基于最邻近的方法在大规模数据库上获得重建。然后d’Angelo等人(2012)进一步发展算法重建只给出LBP特征的图像(Calonder等人,2010;Alahi等人,2012)。他们的方法解决了反转图像和不需要的数据集的问题。KatoandHarada(2014)提出将特征反演作为一个拼图问题来颠倒视觉。由于所学习的视觉表示可能难以解释,因此近来已有可视化工作来了解学习。ZeilerandFergus(2013)提出了一种用于来自卷积神经网络的可视化激活的

7、方法。在相关工作上,Simonyan等人(2013)可视化类外观模型并对深层网络的进行激活。Girshick等人(2013)提出通过找到激活特定特征的图像来可视化卷积神经网络。MahendranandVedaldi(2014)描述了视觉特征从CNN反向结合自然图像的先验的一般方法。图5:本文中,我们提出算法来可视化特征。可视化是更直观的直觉,让人们明白。虽然这些方法有利于重建和从其各自的特征可视化图像,但可视

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。