欢迎来到天天文库
浏览记录
ID:25141458
大小:150.50 KB
页数:9页
时间:2018-11-18
《开题报告--监控系统中的行人检测算法的实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、毕业设计(论文)开题报告题目监控系统中的行人检测算法的实现学院通信工程专业信息对抗技术姓名班级学号指导教师一、综述本课题国内外研究动态,说明选题的依据和意义科学技术的快速发展,在给人带来利益和便利的同时,也给人带来了安全隐患。如为保护某些具有较高的经济价值或技术优势的核心技术及机密而设立的禁区,交通工具的快速行驶等都会给人们带来安全隐患。因此,监控系统(特别是智能监控系统)越来越受到人们的重视。纵观各种影响社会安全稳定的事件,给人们带来严重损失的除不可控因素(地震、火山喷发等)外,主要是人的行为。因此,在监控系统中实现行
2、人检测将可以避免巨大的人身、经济等损失,也成为了国内外研究的热点。目前,清华大学、浙江大学、上海交通大学计算机实验室以及中国科学院自动化研究所等是国内在行人检测研究上比较著名的高校或研究机构。而且,中国科学院自动化研究所的生物识别与安全技术研究中心开发的人脸识别系统已经投入使用(2008年北京奥运会和2010年上海世博会等重大活动)。浙江大学人工智能研究所采用了单目视觉的方法,中科院的李和平、胡占义等提出基于监督学习的异常检测和行为建模算法。国外著名的智能监控系统有IBM的智能监控系统和以色列的IOImage公司推出的智
3、能监控系统。另外,卡耐基梅隆大学开发的NabLab.10系统已经应用于汽车的检测系统。虽然国内的监控系统行业近些年发展较快,但是和国外相比仍有一定的差距。监控系统中行人检测技术研究至今,比较成熟的算法主要有Leibe等人基于“局部特性的编码”进行的行人检测、Oliver等人利用边缘图像来对不同的形状模型进行匹配(ASM)和Dalal与Triggs提出的基于梯度直方图HOG+支持向量机SVM的行人检测算法等。而在所有的行人检测技术,基本都包括了运动目标检测和运动目标识别两个关键技术。运动目标检测是指通过比较视频图像中像素点
4、的变化判断是否有运动物体,并通过图像处理技术将运动目标分割出来。运动目标的检测是运动目标识别的前提和保障,目前主要有光流法和帧差法(包括对称帧差法和背景减除法)。运动目标识别是对运动目标检测阶段获得的运动目标进行处理,识别出其是行人还是其他的物体。目前主要有基于运动的方法、基于模板匹配的方法、基于统计学习方法[3]等。OpenCV是著名的开源的计算机视觉的函数库,由大量的C函数和C++类构成作为接口,实现了图像处理和计算机视觉方面的很多通用算法。而且OpenCV中的机器学习函数库实现了机器学习研究领域中比较常见、应用较为
5、广泛的学习方法,包括了贝叶斯分类器、K邻近算法、支持向量机、决策树、Adaboost算法以及神经网路算法,基本上覆盖了机器学习领域中的主流算法。因此,使用OpenCV能够较灵活的实现行人检测。二、研究的基本内容,拟解决的主要问题:监控系统的行人检测算法的实现主要包括运动目标检测和运动目标识别两个关键技术,在运动目标检测阶段可以采用帧差法,目标识别阶段可以采用基于HOG特征的行人识别。1)帧差法帧差法是指通过当前帧与背景图像相减得到的帧或连续的两帧图像的差值得到中间帧运动对象的轮廓。通过该方法可以获得ROI(感兴趣区域)区
6、域,进一步缩小检测区域。2)HOG特征HOG特征是在被称为单元(cell)和块(block)的网格内进行密集计算得到的,其中有若干像素组成一个单元,若干相邻的单元组成一个块。HOG特征描述了图像局部区域的梯度强度和梯度方向的分布情况,该分布情况能对局部对象外观和形状进行很好的表征,适合于行人检测中肢体的外形变化和自由移动。3)OpenCV监控系统中行人检测算法的实现使用OpenCV开发工具,OpenCV提供了大量的图像处理方面的常用函数,而且是免费开源的,支持多种操作系统。但是OpenCV并不支持所有的视频编码格式。三、
7、研究步骤、方法及措施:研究开始时,首先要学习视频和行人的基本特性,了解OpenCV。接下来要查找文献,了解现在行人检测技术的发展,翻译文献,做出开题报告。然后确定算法流程,学习OpenCV工具。接着利用OpenCV工具实现行人检测算。最后,撰写论文,验收成果并答辩。本文拟采用的流程如下图2所示。输入视频预处理HOG特征提取行人识别图2行人检测流程图视频输入是将通过摄像机或相机等硬件设备采集到的图像视频信息作为信号输入行人检测系统中。预处理包括图像编解码、图像处理、图像分割等,该阶段的目的是将感兴趣区域ROI分割出来,作为
8、下一步HOG特征提取的输入信号。图像分割又分为静态的图像分割和运动的图像分割,前者适合使用背景减除帧差法,后者适合连续帧帧差法。HOG特征提取部分是将感兴趣区域重新编码,输出特征向量作为HOG特征,其主要思想是用梯度方向分布来表示行人形状和直立垂直特性。行人识别阶段是从其它目标中区分出行人,主要通过行人特定的特征匹配
此文档下载收益归作者所有