机器学习与应用 第11讲卷积神经网络ppt课件.ppt

机器学习与应用 第11讲卷积神经网络ppt课件.ppt

ID:59250064

大小:1.86 MB

页数:33页

时间:2020-09-22

机器学习与应用 第11讲卷积神经网络ppt课件.ppt_第1页
机器学习与应用 第11讲卷积神经网络ppt课件.ppt_第2页
机器学习与应用 第11讲卷积神经网络ppt课件.ppt_第3页
机器学习与应用 第11讲卷积神经网络ppt课件.ppt_第4页
机器学习与应用 第11讲卷积神经网络ppt课件.ppt_第5页
资源描述:

《机器学习与应用 第11讲卷积神经网络ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、通用目标检测通用目标检测要同时检测图像中的多种类型目标。各类目标的形状不同,因此目标矩形的宽高比不同处理这一问题的经典方法是人工特征+分类器方案,典型的是DPM(deformablepartsmodel)。面对复杂的检测任务,这类方法的精度难以大幅度提升卷积网络被成功用于通用目标检测问题,R-CNN系列算法是典型的代表通用目标检测要解决的核心问题:1.目标可能出现在图像的任何位置上2.目标可能有各种不同的大小3.目标有各种不同的形状。如果用矩形框来定义目标,则矩形有不同的宽高比评价检测效果时使用IOU指标这是算法检测出来

2、的矩形框如真实的目标矩形框的交并比,该值越大,则这个检测结果越准确R-CNN抛弃了滑动窗口技术,改用启发式搜索技术提取图像中所有可能是目标的候选区域,这些候选区域称为regionproposals然后用卷积网络提取这些候选区域的特征,得到固定维数的特征向量最后用线性支持向量机进行分类,判断它是目标还是背景R.Girshick,J.Donahue,T.Darrell,J.Malik.Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation

3、.IEEEConferenceonComputerVisionandPatternRecognition(CVPR),2014目标检测的流程分为以下4步1.用selectivesearch算法从待检测图像中提取可能是目标的候选区域。与滑动窗口技术相比,这种方法将候选窗口减少了至少2个数量级2.用卷积分别网络提所有取候选区域的特征,每个候选窗口得到固定长度的特征向量3.使用线性支持向量机对上一步提取的特征向量进行分类,确定它是不是某一类目标4.对目标位置和大小进行调整最后还要对检测结果进行非最大抑制不采用滑动窗口技术的原因

4、:计算成本高,会产生大量的待分类窗口;不同类型目标的矩形框有不同的宽高比,无法使用统一尺寸的窗口对图像进行扫描用于提取候选区域特征的卷积网络输入数据是固定大小的RGB图像,输出为4096维向量对候选区域的分类采用的是线性支持向量机,对待检测图像计算所有候选区域的特征向量,送入支持向量机中进行分类SPP网络R-CNN算法虽然比之前的算法有很大的进步,但它还是存在下列问题1.用于提取特征的卷积网络只能接受固定尺寸的输入图像,要缩放到统一尺寸然后再送入网络进行处理,非常耗时2.所有候选区域都要送入卷积网络计算一次,对于有重叠区

5、域的候选窗口,存在重复计算3.由于卷积网络只能接受固定尺寸的图像,为了适应这个图像尺寸,要么截取这个尺寸的图像区域,这将导致图像未覆盖整个目标;要么对图像进行缩放,这会产生扭曲。无论哪种情况,都会影响检测精度SPP网络致力于解决上面的问题,它通过引入一种称为SPP(SpatialPyramidPooling)的池化层解决卷积网络只能接受固定尺寸输入图像这一核心问题K.He,X.Zhang,S.Ren,andJ.Sun.Spatialpyramidpoolingindeepconvolutionalnetworksforv

6、isualrecognition.InECCV.2014在卷积网络中,卷积层并不要求输入图像的尺寸固定,只有第一个全连接层需要固定尺寸的输入,因为它和前一层之间的权重矩阵是固定大小的,其他的全连接层也不要求图像的尺寸固定如果在最后一个卷积层和第一个全连接层之间做特殊处理,将不同大小的图像变为固定大小的全连接层输入就可以解决问题把待处理图像在多个尺度上划分成网格,然后对每个网格进行池化,最后将各个尺度的池化结果拼接起来形成一个固定长度的向量在检测时只对整个图像进行一遍处理对于输入图像的所有候选窗口,在经过所有卷积层之后,对

7、原始图像的所有候选区域在卷积特征图像中对应的子图像做SPP操作,形成固定长度的向量然后送入全连接层进行处理,形成特征向量,这样就消除了特征提取的重复计算训练时要分两部分进行训练。因为SPP层是自适应尺度的池化,因此无法通过反向传播算法将误差项传播到它前面的层卷积层采用预训练的策略提前训练好,然后训练全连接层,这用标准的反向传播算法实现FastR-CNN对SPP网络的改进。其主要创新是用ROI池化层替代SPP层,以及在一个卷积网络中同时对候选区域进行分类和矩形框回归,不再使用支持向量机对候选区域进行分类实现了端到端的训练和

8、检测FastR-CNN算法以整个图像以及目标候选区域列表作为输入,卷积网络先用若干卷积层和池化层对整个图像进行处理,得到特征图像然后对每个候选区域用ROI池化层从特征图像中提取出固定长度的特征向量特征向量被送入全连接层中,最后一个全连接层后有两个输出层第一个输出层用softmax回归进行分类,包括k个目标类和一个背景

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。