金准人工智能智能监控场景下的大规模并行化视频分析方法

金准人工智能智能监控场景下的大规模并行化视频分析方法

ID:10252463

大小:5.81 MB

页数:25页

时间:2018-06-13

金准人工智能智能监控场景下的大规模并行化视频分析方法_第1页
金准人工智能智能监控场景下的大规模并行化视频分析方法_第2页
金准人工智能智能监控场景下的大规模并行化视频分析方法_第3页
金准人工智能智能监控场景下的大规模并行化视频分析方法_第4页
金准人工智能智能监控场景下的大规模并行化视频分析方法_第5页
资源描述:

《金准人工智能智能监控场景下的大规模并行化视频分析方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、金准人工智能智能监控场景下的大规模并行化视频分析方法前言深度学习在图像识别、智能视频分析技术方面的精度不断提升,使得安防成为了深度学习快速落地的最清晰方向之一,而计算力的发展,使得大规模的并行计算成为了可能。人工智能和机器人研究所借助双路TeslaP100GPU强大的并行计算能力,基于大规模深度神经网络构建了智能视频分析系统,实现了对多路视频流的实时处理以及对大规模离线监控录像的高效分析,极大地加速了视频处理的运行效率。一、智能监控领域的应用背景以及行业进展目前来说,智能安防是智慧城市非常重要的一项组成部分。智能安防主要包括视频监控以及人脸识别这些已经落地的商业应用,此外,智能安防还和目前

2、非常火爆的无人驾驶息息相关。 上图视频监控占整个安防行业的50%,而且呈现逐年上升的趋势。在其他方面,包括实体防护、出口控制、防盗报警等几项应用也瓜分了安防市场50%的份额,而近年来,中国安防行业市场规模也在逐年扩大,从2011年的2773亿直接涨到了2017年的6540亿,每年都有15%到20%增长率,是非常具有应用场景的一个行业。 智能监控都要做些什么呢?传统的监控领域,仅仅是用监控设备去拍一些监控视频,然后由人来对视频中一些敏感的目标进行分析。而智能视频监控,旨在通过视觉模式识别技术,对监控视频中目标、行为、事件等对象来进行智能识别和分析。比如我需要检测监控场景里面都有哪些目标,其中

3、有人还是车,再分析监控场景中目标的行为,对监控视频中的一些敏感事件进行检测等。 随着深度学习技术的发展,智能监控所用到的检测、识别、跟踪等技术已经达到了非常高的精度,大家可以看图中从上到下分别是人脸检测与识别、行人检测与跟踪、行人姿态估计、车辆检测、车型识别以及交互识别等几大主要领域,而视频监控需要把这些领域的技术融合起来,然后对监控视频做各个维度的分析。二、基于深度学习的视频分析技术基于深度学习的视频分析技术概括。下图大致把目前最核心的几个技术给列了出来: 首先是目标检测,这个不用介绍,金准人工智能专家相信做过视觉的同行大都了解此领域。目标检测和图像分类是视觉技术中一个非常基础的任务,其

4、目的就是跟踪场景中感兴趣的一些物体,包括常规的目标检测、人员检测以及车辆检测等等;目标检测完成以后,需要针对每个检测到的目标来计算其运动轨迹,根据目标的数量以及摄像头的数量,可以分为单目标跟踪、多目标跟踪,单摄像头跟踪、跨摄像头跟踪等;人脸识别又是另一个已经落地的商业应用,它主要是为了识别或验证场景中的人脸,包括人脸检测、关键点检测、属性分析、人脸比对以及检索等;而行为识别是为了识别人体动作以及人与物体之间的交互,现在做行为识别比较简单一点的任务,就是在一段视频中去判断里面是否发生了某个动作,稍微难一点的是做行为检测,需要从一段很长的视频中去找出每个动作所发生的时间段;而更难一些的还要识别

5、出动作的主体、客体以及交互的对象、动作的状态等;还有一个应用领域是图像增强,也是最近进展比较快的。在我们监控到的视频中,它很容易受到环境和视频采集设备的影响。通常我们采集到的视频是不理想的,伴有噪音、运动模糊等,是需要进行视频方面的增强,比如做超分、去模糊、去抖动以及去雾、去雨雪之类的。1.目标检测目标检测需要把场景中所有感兴趣的目标逐个地给框出来,并识别出这个目标的类别,也是视频监控分析时所用到的第一步。 对于一个场景,常常需要把场景中的行人、车辆等目标挨个点出来,并且还需要把它们的边框准确的框出来,框出来以后才可以进行下一步再识别等任务。 目前检测领域主要分为两大方法:基于区域的检测算

6、法和基于回归的检测算法。基于区域的检测方法,一般是通过两阶段的算法,分为区域候选阶段和区域检测阶段:区域候选阶段,就是通过候选框生成算法先从大图里面找到目标潜在的位置,比如传统的SelectiveSearch、Edge Boxes和基于CNN的RPN方法;区域检测阶段,就是从区域候选阶段得到候选框后再去做进一步精细的分类和定位,目前主流的方法包括R-CNN以及R-CNN的各种改进版。基于回归的检测方法是另一个流派,从YOLO开始,到之后的SSD做了进一步的定位优化,这种方法基本上采用的是单阶段直接回归检测框的思路。它比较显著的一个特点就是检测速度非常快,可以做到实时性,它的缺点是,相比基于

7、区域的检测方法,其定位精度往往会差一些。 上图是目前最流行的基于区域的FasterR-CNN检测算法的示意图。 完成检测以后,我们仅仅是知道场景中有哪些目标以及它们的位置,如果需要做进一步分析,需要知道每个目标的ID是多少,同时还需要跟踪每个目标的运动轨迹来确定视频里面每一帧目标所属的ID。金准人工智能专家目前做行人的tracking需要较好的ID特征,通常先用PersonReID任务的数据集训练一个网络,然后提取一个比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。