单个深层神经网络检测图像中对象的方法SSD

ID：29694269

大小：880.10 KB

页数：12页

时间：2018-12-22

资源描述：

《单个深层神经网络检测图像中对象的方法SSD》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、SSD:SingleShotMultiBoxDetector摘要：我们提出了一种使用单个深层神经网络检测图像中对象的方法。我们的方法，名为SSD，将边界框的输出空间离散化为一组默认框，该默认框在每个特征图位置有不同的宽高比和尺寸。在预测期间，网络针对每个默认框中的每个存在对象类别生成分数，并且对框进行调整以更好地匹配对象形状。另外，网络组合来自具有不同分辨率的多个特征图的预测，以适应处理各种尺寸的对象。我们的SSD模型相对于需要regionproposal的方法是简单的，因为它完全消除了proposal生成和后续的像素或特征重采样阶段

2、，并将所有计算封装在单网络中。这使得SSD容易训练和直接集成到需要检测组件的系统。PASCALVOC，MSCOCO和ILSVRC数据集的实验结果证实，SSD与使用额外的regionproposal的方法具有可比较的准确性，并且速度更快，同时为训练和推理提供统一的框架。与其他单级方法相比，SSD具有更好的精度，即使输入图像尺寸更小。对VOC2007，在300×300输入，SSD在NvidiaTitanX上58FPS时达到72.1％的mAP，500×500输入SSD达到75.1％的mAP，优于类似的现有技术FasterR-CNN模型。代码

3、链接：https://github.com/weiliu89/caffe/tree/ssd。关键词：实时对象检测;卷积神经网络1、引言当前，现有对象检测系统是以下方法的变体：假设边界框，对每个框重新取样像素或特征，再应用高质量分类器。选择性搜索[1]方法后，FasterR-CNN[2]在PASCALVOC，MSCOCO和ILSVRC检测取得领先结果，这种流程成为检测领域的里程碑，具有更深的特征，如[3]所述。尽管准确，但这些方法对于嵌入式系统来说计算量过大，即使对于高端硬件，对于实时或接近实时的应用来说也太慢。这些方法的检测速度通常以

4、每秒帧数为单位进行测量，高精度检测器(基础FasterR-CNN）最快仅以每秒7帧（FPS）运行。目前，已有广泛的尝试，通过研究检测流程的每个阶段（参见第4节中的相关工作）来建立更快的检测器，但是迄今为止，显着增加的速度仅仅是以显着降低的检测精度为代价。本文提出了第一个基于深层网络的对象检测器，它不会对边界框假设的像素或特征进行重新取样，但和这种做法一样准确。这使高精度检测速度有显着提高（在VOC2007测试中,58FPS下72.1％mAP，对FasterR-CNN7FPS下mAP73.2％，YOLO45FPS下mAP63.4％）。速

5、度的根本改进来自消除边界框proposal和随后的像素或特征重采样阶段。这不是第一篇这么做的文章（cf[4,5]），但是通过增加一系列改进，我们设法提高了以前尝试的准确性。我们的改进包括使用不同宽高比检测的单独的预测器（滤波器），预测边界框中的对象类别和偏移，并且将这些滤波器应用于网络后期的多个特征图，以便执行多尺度检测。通过这些修改，我们可以使用相对低分辨率的输入实现高精度检测，进一步提高处理速度。虽然这些贡献可能独立看起来很小，但我们注意到，所得系统提高了PASCALVOC的高速检测的准确性，从YOLO的63.4％mAP到我们提出

6、的网络的72.1％mAP。相比近期工作，这是在检测精度上的较大提高，残差网络上的卓越工作[3]。此外，显着提高高质量检测的速度可以拓宽计算机视觉有用使用范围。总结我们的贡献如下：-我们引用了SSD，一个单次检测器，用于多个类别，比先前技术的单次检测器（YOLO）速度更快，并且更准确很多，实际上和使用regionproposal、pooling的更慢技术一样准确（包括FasterRCNN）-SSD方法的核心是使用小卷积滤波器来预测特征图上固定的一组默认边界框的类别分数和位置偏移。-为了实现高检测精度，我们从不同尺度的特征图产生不同尺度的

7、预测，并且通过宽高比来明确地分离预测。-总之，这些设计特性得到了简单的端到端训练和高精度，进一步提高速度和精度的权衡，即使输入相对低分辨率图像。-实验包括在PASCALVOC，MSCOCO和ILSVRC上评估不同输入大小下模型耗时和精度分析，并与一系列最新的先进方法进行比较。2、单次检测器（SSD）本节介绍我们提出的SSD检测架构（第2.1节）和相关的训练方法（第2.2节）。之后，第3节呈现特定数据集的模型细节和实验结果。图1：SSD架构。（a）SSD在训练期间仅需要每个对象的输入图像和真实标签框。卷积处理时，我们在具有不同尺度（例如

8、（b）和（c）中的8×8和4×4）的若干特征图中的每个位置处评估不同横宽比的小集合（例如4个）默认框。对于每个默认框，我们预测对所有对象类别（（c1，c2，...，cp））的形状偏移和置信度。在训练时，我们首先将这些默认

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 12



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

单个深层神经网络检测图像中对象的方法SSD

单个深层神经网络检测图像中对象的方法SSD

相关文章

相关标签