《基于hog特征的行人检测系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
...-.-I.;'■一.:-?■、-?4.-I';^一,片班'..一.、、.去一293:单位代码:10密鑛公开t—考巫#化硕女给A?VU',堂.寺命《I戀论文题目:暮于HOG特征的行人检测系统的研究学号1213012207姓名刘文振.?一导师卢官巧教梧'专业学位类别工掉硕+'类型全日衝I专业(领域)电子与巧信工掉论文提交日期二零一六年H月 南京邮电大学学位论文原创性声明-'本人声明所呈交的学位论文是我个人在导师指导K进行的研究作及取得的研究成果。’论文中不包含其他人己经发表或撰写过尽我所知,除了文中特别加示注和致谢的地方外证书而使用过的材料。的硏究成果,也不包含为获得南巧邮电大学或其它教育机构的学位或一了明确的说明并表示丫谢意与我同工作的同志对本研究所做的任何贡献均己在论文中作。。本人学位论文及涉及扣关资料若有不实,愿意承巧切相关的法律责任:全研巧生签名:^日期班南京邮电大学学位论文使用授权声明本人授权南京邮电大学可抖保留并向围家有关部口或机构送交论文的复印件和电子文可档:允许论义被杏阅和借阅:可^以将学位论文的全部或部分内容编入有关数据库进行检索;论W采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质文涉的内容相--导咬。论文的公布(包巧刊登)授权南京邮电大学研究生院办理。密学位论文在解密后适巧本授权书。W韦唯占y研究生签名:i献导师豁名:卢日期: ResearchonHOG-basedPedestrianDetectionSystemThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByLiuWenzhenSupervisor:Prof.LuGuanmingMarch2016 摘要行人检测是计算机视觉中一个重要的研究领域,对当今人们生活质量的提高有着重要的意义,如楼宇智能监控系统、汽车辅助驾驶系统以及高级的人机接口等领域都扮演着重要的角色。由于检测环境中背景的多样性、天气光照的变化、行人运动姿态的不确定性以及衣着的多样性等因素的影响,使得行人检测不同于其他的目标检测。除此之外还要考虑实时性的要求。本研究主要针对视频序列中的行人进行检测,结合行人的运动信息实现在摄像头固定情况下对行人的检测与识别,并针对检测出的行人进行跟踪,主要工作如下:1、采用背景差分的方法检测出运动目标,Vibe算法是基于背景差分的思想提出的能快速建立背景的运动目标检测算法。针对Vibes算法容易出现残影的不足,文中将Vibe算法与OTSU算法相融合,达到了快速消除残影目的。并针对运动目标肯能出现的阴影进行去除,实现行人可能区域的快速定位。2、对于检测出的运动目标区域提取其HOG特征作为特征描述符。针对HOG特征维度较高而导致检测速度较慢的不足,运用PCA算法进行特征降维,最终得到HOG-PCA特征。运用SVM分类器进行分类训练。经过实验验证,经过PCA降维后的HOG特征能够在不降低识别率的前提下达到提高检测速度的目的。3、为了提高视频行人检测的实时性,系统加入了行人目标跟踪模块,将CamShift算法与Kalman滤波器相结合,对行人发生短暂遮挡的情况进行预测定位,实现了对行人的实时稳定的跟踪。最后将所有模块相融合形成视频序列行人检测与跟踪系统,通过实验表明本行人检测系统能够达到较高的识别率和较快的检测速度。关键词:行人检测,梯度直方图特征,特征降维,CamShift算法,卡尔曼滤波I AbstractPedestriandetectionisanimportantresearchareainthecomputervision,whichhasanimportantsignificancetoimprovethequalityofpeople’slife.Inthefieldofsecurity,especiallyinbuildingintelligentmonitoringsystem,automotivedriverassistancesystemandadvancedhuman-machineinterface,itplaysanimportantrole.Duetothediversityofbackground,thechangingweatherandlight,pedestrianmovementandposture’suncertainty,clothingdiversityandotherfactors,itisdifficulttoimplementpedestriandetectionwithrespecttotheothertargetdetection.Besides,researchersalsoneedtoconsiderthereal-timerequirement.Thepapermainlystudiestheclassificationandrecognitionofpedestriancombinedwiththepedestrianmovementinformationinthesceneoffixedcamera,andthetracktothedetectedpedestrianisalsoconsidered.Themainworkisasfollows.First,backgroundsubtractionmethodisproposedtodetectmovingtargets.Vibeisamovingtargetdetectionalgorithmbasedonbackgroundsubtractionidea.Inthepaper,thealgorithmusedinconjunctionwithVibeandOSTUalgorithmcanquicklyeliminatetheareaofGhost,andremovetheshadowsmovingtargetthatmayarisetogetmorerealisticpictureofprospectmovingtargets.Second,thepaperextractstheHOGfeaturesofthedetectedmovingobjectsasthefeaturedescriptors.Duetothehigherdimensionsresultinginslowerspeedsinsufficient,aPCAalgorithmthatanreducedimensionisusedtogetHOG-PCAfeaturedescriptor,thenclassifytrainingisusedwithSVMclassifier.Experimentalresultsshowthatthisalgorithmcanimprovethedetectionspeedwithoutreducingtherecognitionrate.Inordertoimprovethereal-timeofvideopedestriandetection,pedestriantrackingmoduleisincluded.Inthepaper,anewalgorithmcombinedCamShiftalgorithmwithKalmanalgorithmisabletosolvethecaseoftheoccurrenceoftransientocclusionofthepedestrianandachievereal-timepedestrianstabletracking.Finally,theintegrationofallmodulesformsavideosequencepedestriandetectionandtrackingsystem,theexperimentsshowthattheproposedpedestriandetectionsystemcanachievehigherrecognitionrateandfasterdetectionspeed.Keywords:PedestrianDetection,HOG,FeatureDimensionReduction,CamShift,KalmanII 目录第一章绪论..............................................................................................................................................................11.1研究背景及意义........................................................................................................................................11.2国内外研究现状........................................................................................................................................21.2.1运动目标检测研究现状................................................................................................................31.2.2行人跟踪研究现状........................................................................................................................51.3行人检测研究难点....................................................................................................................................71.3.1准确性............................................................................................................................................71.3.2实时性............................................................................................................................................71.4本文主要研究内容以及章节安排............................................................................................................8第二章前景目标的检测与阴影消除......................................................................................................................92.1运动物体检测............................................................................................................................................92.1.1帧差法............................................................................................................................................92.1.2光流法..........................................................................................................................................102.1.3背景减法......................................................................................................................................122.1.4基于改进Vibe算法的目标检测.................................................................................................132.2快速归一化互相关阴影检测与消除......................................................................................................172.3本章小结..................................................................................................................................................20第三章基于HOG-PCA特征的行人检测.............................................................................................................213.1行人特征提取的基本算法......................................................................................................................213.2行人分类的基本算法..............................................................................................................................233.2.1神经网络分类算法......................................................................................................................233.2.2决策树分类器..............................................................................................................................243.2.3贝叶斯分类器..............................................................................................................................253.2.4SVM分类算法.............................................................................................................................253.3HOG-PCA特征的理论基础....................................................................................................................263.3.1HOG特征基本原理.....................................................................................................................273.3.2主成份分析算法(PCA)原理........................................................................................................313.4基于HOG-PCA特征的行人检测...........................................................................................................323.4.1行人检测样本集..........................................................................................................................333.4.2基于HOG特征的行人检测........................................................................................................333.4.3基于HOG-PCA特征的行人检测..............................................................................................343.5本章小结..................................................................................................................................................36第四章Camshift与Kalman相结合的行人跟踪..................................................................................................374.1人体运动目标跟踪的基本方法..............................................................................................................374.1.1基于运动状态信息的目标跟踪..................................................................................................374.2基于卡尔曼滤波的人体运动目标跟踪..................................................................................................384.2.1卡尔曼滤波器的基本原理..........................................................................................................384.2.2卡尔曼滤波器参数设定..............................................................................................................414.3基于Camshift算法的人体运动目标跟踪..............................................................................................414.3.1Meanshift算法..............................................................................................................................424.3.2Camshift算法...............................................................................................................................444.4基于Camshift算法和Kalman预测的人体运动目标跟踪...................................................................454.5本章小结..................................................................................................................................................47III 第五章实验结果与分析........................................................................................................................................485.1实验性能评价指标..................................................................................................................................485.2实验步骤..................................................................................................................................................485.3实验结果与分析......................................................................................................................................495.4本章小结..................................................................................................................................................52第六章总结与展望................................................................................................................................................536.1总结..........................................................................................................................................................536.2研究展望..................................................................................................................................................54参考文献..................................................................................................................................................................55致谢..........................................................................................................................................................................58IV 南京邮电大学专业学位硕士研究生学位论文第一章绪论第一章绪论1.1研究背景及意义当今社会,科学技术飞速发展,各种新技术层出不穷,尤其是计算机科学的发展,运算能力的提升,给许多科研的研究提供了方便。如何让计算机更好的服务于人类,这也是近年来研究的热点。现在计算机能够做到许多以前只有人类才能完成的任务,如温室大棚内温度智能调节系统、机动车辆的智能驾驶系统、主要街道路口的人流量监控系统等等。这些系统都是通过摄像头采集视频影像,然后送入计算机进行分析理解处理,就像人类通过自己的眼睛获取信息一样,是计算机视觉领域研究的重中之重。而行人检测是这个研究领域的显著代表,通过对图像或者视频序列中的行人进行检测,并对检测出的行人进行行为分析与跟踪处理,实现了自动化的管理监控,这也是科技改变生活的重要体现。[1]行人检测,作为一个广泛应用在模式识别、计算机视觉以及人机交互等领域中的一项热门技术,它在我们的生活中扮演者重要的角色,是一个很有研究价值和应用价值的研究方向。所谓行人检测,就是通过特征提取、分类识别等方法,从待检测的静态图像或者视频序列中分辨出是否有行人存在,当检测出行人时,则对行人进行定位,并且在图像或者视频序列中标志出。是后序行人跟踪及行为分析的重要基础,由此可见行人检测的重要性。这里简单的介绍一下行人检测在车辆辅助驾驶系统以及安防智能监控系统领域中的应用,行人检测在这些领域中的应用具有很高的商业价值和广泛的应用前景。1、车辆辅助驾驶系统据世界卫生组织分析,每年因为公路交通事故而死亡的人数呈逐年上升趋势,严重影响着人类的生命财产安全,如何通过有效的方法来减少交通事故的发生成为每个国家政府关注[2]的事情。基于计算机视觉的行人检测的研究,在车辆辅助驾驶系统中有着很重要的应用价值,因而成为智能车辆邻域最为活跃的研究课题。从2000年开始,欧盟连续资助PROTECTOR[3]和SAVE-U项目,并取得了不错的成果,开发了两套行人检测系统。日本本田汽车公司开发了基于红外线摄像机的行人检测系统,国内大学和科研机构也都做了相关的研究,比如CMU、MIT和国内的西安交通大学、清华大学等。这些系统的功能主要是检测车辆前面是否有行人的通过,系统会根据距离行人的远近而给予驾驶员提示,辅助驾驶员驾驶,此功能能够在驾驶员疲劳驾驶或者注意力不集中的情况下,对车辆前方的行人注意不到的情况下,辅助驾驶员,确保车辆和行人的安全,避免造成不必要的人身事故。1 南京邮电大学专业学位硕士研究生学位论文第一章绪论2、安防智能监控在传统的视频监控系统中,视频内容的分析识别需要人工实现,由于视频内容的纷繁复杂,需要大量的人员参与其中,工作量相当大并且由于人员的疏忽容易出错。相比之下,智能视频监控系统实现自动检测分析,只需很少的工作人员的参与。高性能的智能监控系统能够达到很低的误判率,因此成为了近年来研究的热点。视频智能分析通常可以分为运动目标[4]的识别、目标跟踪与行人分析。某些比较重要的场合,比如银行、军事基地、车站等等,智能监控能够检测到行人,并能够判断行人是否有异常行为从而提醒操作人员作出反应,保[6]护人民和国家的生命财产安全。车志富等人在文献中主要研究了行人检测系统在地铁监控环境中的应用,在当今反恐形势异常严峻的局势下,地铁行人监控系统也是重要的应用邻域之一。1.2国内外研究现状基于行人检测技术有着广阔的应用前景和巨大的商业价值,许多国内外企业和和研究机构都专门成立了研究小组,做了深入的研究,并取得了丰硕的成果。在视频行人检测与跟踪领域,国外的研究起步比较早,美国自然科学基金会和美国军方就开始研究在复杂环境下行人目标的检测、跟踪与识别算法的研究与应用,早在1991年,美国国防高级研究项目暑(DARPA)就开始资助卡内梅隆大学进行视觉信息在无人机中的应用研究,1997年,DARPA再一次邀请卡内梅隆和其他多所美国知名高校参与视频监控重大项目的研发工作,开发出了包括视频场景处理、运动目标检测与识别、运动目标的跟踪与行为理解多摄像头联合跟踪等涉及许多核心的技术和应用功能的系统。为了加强国防和避免民用场所受到恐怖分子的侵袭,2000年,美国国防高级研究项目暑开展了远程行人识别计划,主要研究了行人的检测、分类与识别,实现了对恐怖袭击事件进行事先预警的功能。美国马里[5]兰大学的Haritaolu等人开发出了4W(What,Where,When,Who)视频实时监控系统,4W系统将目标检测与跟踪技术和形状分析相结合,建立了行人轮廓模型,实现了视频序列中行人的检测,并能够识别出行人的站立、坐、躺等姿势以及携带行李等行为。1999年,欧盟信息社会技术的成员也展开了相关技术的研究,他们通过研究视频序列中的人群和个人行为,实现人机交互,有效的管理公共交通网络,缓解了密集场所的人群压力。以色列在智能视频监控系统方面的研究也达到了先进的水平,其中MobilEye公司开发出了芯[8-9]片级的行人检测系统,其开发的系统主要应用在边界布防和商业系统分析。在2004年第11届ITS世界大会上,来自日本的本田汽车公司展示了INV(Intelligentnightvision)系统,该2 南京邮电大学专业学位硕士研究生学位论文第一章绪论系统采用红外摄像头实现了车载夜视行人检测的功能。在国内,智能视频监控系统的研究起步较晚,虽然相比于西方国家还有一定的差距,但是作为一个热门的研究方向,许多专家学者都投入大量的精力去研究,并取得了不错的成果。[10][7]研究该邻域的院校有清华大学、北京大学、上海交通大学、中科院、华中科技大学等院校。其中,中国科学院自动化研究所在此领域的研究处于领先地位,并成立了视觉监控研究小组,通过对生活中的各种交通场景的监控、运动行人的视频监控、目标行为的模式识别等进行了深入的研究。其研究成果在2008年北京奥运会期间的安保工作中发挥了不可或缺的作用。除了各大高校,国内的也有很多公司机构也为智能视频监控系统的发展起到推波助澜的作用,如中电十八所、杭州捷尚、公安部等等。每年举行的国际社会公共安全博览会上都会展出智能视频监控方面的大量最新产品,可见智能视频监控中行人检测与跟踪在最近几年得到快速发展。1.2.1运动目标检测研究现状运动目标的检测方法可分为两类:基于模型的检测方法和基于分类的检测方法。基于模型的检测方法中,通常是采用人体的局部特征或者是人体的四肢模型来表征类别的局部的属性,结合人体的某些局部特征的空间结构特性来学习或者描述类别的分布模型。基于模型的方法在图片中搜索肢体或者人体的局部特征,并通过生成的模型方法计算出运动目标的位置。基于分类的检测方法主要思想是通过大量的正负样本集训练出分类器。在待检测图片上,通过提取特征,送入分类器进行训练,获得分类为运动物体在搜索窗口中的位置,最终融合处理得到准确的运动物体的位置。基于分类的行人检测方法适用于外轮廓较一致的运动物体,如汽车、行人、手势等。这两种检测方法各有其特点,基于模型的检测方法相比之下更适合具有结构活动性的类别,如运动的人体目标。除此之外,该方法能较为有效的估计出运动物体的姿态等相关参数。实际情况下,由于运动目标的背景复杂多变、视角和外观各异等干扰因素的影响,对于外轮廓较为一致的类别,基于分类的检测方法更适合。下面就简单介绍基于分类的检测方法的研究现状。[51]2001年Viola等人在文献中第一次提到基于级联结果的人脸检测方法。该方法是目标检测方向的一次突破。论文中运用Harr-like特征来描述人脸的五官特征,并通过Adaboost算法来筛选出符合人脸的Harr-like特征。运用层级结构的分类方法能够快速高效的排除大量的背景区域,能够实时的检测出人脸的正面区域。这个框架也为以后的人脸检测和其他的检测研究提供了理论基础。3 南京邮电大学专业学位硕士研究生学位论文第一章绪论除了正面的人脸视角外,对于包含俯视、仰视和左右两侧等较宽的人脸视角范围也需要[56]进行检测。Li等人基于AdaBoost算法提出了FlostBoost算法。并将检测的视角区域从粗到细进行划分,构建出金字塔式结构的人脸分类器组,这种改进算法实现了快速的多视角人脸[57]检测。Huang等人提出宽度优先搜索的树形检测结果,并对树形结果提出VectorBoost算法,此种改进算法对多视角的人脸检测问题有很好的检测效果。且计算复杂度小,能够达到较高的检测率和准确度。在日常场景的图像中能够有效的检测出人脸。与人脸检测相比,由于人体的姿态千变万化、视角以及外观各不相同,使得行人检测更具有挑战性。除此之外,光照的不同、相互遮挡和复杂的背景等因素的干扰,同样增加了行人检测的难度。2005年Dalal首次提出梯度方向直方图的概念,作者结合SVM分类器取得了行人检测领域的突破性进展。HOG特征在图像窗口内均匀密集的提出局部方向直方图,HOG特征能够充分的表现行人形状和外观信息。能够有效的区分行人与其他物体或者背景。将此方法运用到INRIA行人库上,取得了较好的检测效果。自此以后,行人检测迅速发展,成为图像处理和模式识别领域的研究热点,出现了许多优秀的检测方法。Zhu等人提取了层级结构的检测方法对此方法进行改进,该改进算法对每个层级都有可变尺寸图像上的HOG特征进行训练。检测中通过层级分类器来排除非行人窗口,提高了检测速度。HOG特征能够取得较高的检测率主要是取决于其对行人外观的描述能力。研究人员后来又提出一些新的特征或者与HOG相结合来进行改进。文献[58]将可变的LBP特征与HOG特征进行融合,提高了检测性能。Wu和Nevatia结合HOG特征、Edgelet特征和协方差描述子提出一种层级训练方法,得到了更好的检测效果。文献[59]和文献[60]都将HOG特征与光流方法进行结合,能够显著的提高视频行人的检测速度。近年来,研究人员也提出的一些新的分类算法。Maji等人提出一种金字塔结构的HOG特[33]征和基于HistogramIntersection核的检测算法。Schwartz等人提出PLS分析对特征空间进[46]行降维提取出有效的特征,取得了很好的检测效果。Felzenszwalb等人提出一种活动肢体[47]模型检测方法。针对每个肢体都采用HOG特征与SVM分类器,对于行人、汽车等目标都[48]取得了不错的检测效果。Huang等人基于灵活性的JroG特征来训练分类器。该方法比较多对小格之间的灰度值,联合模拟退化方法和增量特征选择方法来训练,取得了优秀的检测结果,也取得了较高的检测速度。复杂场景中行人容易发生相互遮挡的情况,这也是行人检测中存在的一个难点。Wang等人对窗口的HOG分类值图进行区域分析,依此来判断行人是否存在遮挡,接着采用半身分类器检测没有遮挡的部分。Huang等人训练上下半身和左右半身四个分类器,采用动态搜索4 南京邮电大学专业学位硕士研究生学位论文第一章绪论的方法解决了遮挡问题。上述这两种算法在某种程度上都能够有效的解决遮挡问题。Liwan[49]提出Deep运用判别模型来学习局部间的视觉关系,也有效的克服了部分遮挡问题。许多行人检测方法都存在提取的特征维度较高,并且需要进行密集式扫描,很难达到实时性。Benenson等人提出多尺度分类器,结合尺度间的窗口特征估计技术,避免了检测时图像的缩放,并采用Stixel技术来估计图像深度信息,达到了较高的检测速度。行人检测的一个主要的应用邻域是视频监控。针对此应用场景研究人员提出了新的检测方法。在视频序列中,运动前景包含行人特有的运动特征。ZheLin等建立行人局部模板树对行人进行建模,采用Canny边缘和运动前景来进行层级模板匹配以实现检测。Roth等人对场景中的每个位置都训练各自的分类器。这一策略特别适合视频序列的应用场景。WangMeng等人基于transfer学习框架提出了一种将一般性分类器自动训练位场景特定分类器的方法,在实际监控场景能明显低提高检测率。1.2.2行人跟踪研究现状运动目标跟踪方法一般都需要首先建立目标的模型,然后在图像序列中定位出运动目标或者获取目标的运动状态。目标跟踪需要关注的是具体的运动个体,对具体的运动目标的形状以及外观等建立观测模型,因而描述方法和特征灵活多变。运动目标检测、分类及图像特征等计算机视觉中的很多其他方法,也可以用来描述、辨别或观测具体目标。除此之外,EM算法、Ransac算法以及分类方法等机器学习方法都可以应用于目标跟踪,因而也难以对已有的跟踪方法进行明确分类。运动目标跟踪大体可分为概率跟踪方法和确定跟踪方法。概率跟踪方法主要思想是通过求解目标观测的后验状态概率来进行目标定位。1996年,Isard等人首次采用粒子滤波算法进行视觉跟踪,自此以后,此种算法成为了视觉跟踪领域的主流算法。粒子滤波算法是通过一组数据粒子来近似表示状态概率密度分布,通过观察每个粒子对应的模型来确定对应的窗口,在多模分布的情况下进行跟踪定位。该算法的观察模型可以灵活多变。Ross等人就是采用运动目标的本征作为观测模型,并通过增量学习算法以适应目标的外观,该算法能够克服光照的变化,跟踪效果良好。Loza等人采用结构相似度模型描述目标运动窗口,并建立的观测模型,有效的解决了尺度和灰度的变化问题。LiYuan等人利用运动目标检测器进行目标跟踪,结合检测检测器、精检测器和跟踪器,并提出层级粒子滤波方法,能够有效的解决目标的突变运动的情况。确定性目标跟踪方法通常用的是目标模型,包括图像向量模型和基于统计特征的模型等,5 南京邮电大学专业学位硕士研究生学位论文第一章绪论Meanshift跟踪方法是一种基于核概率密度估计和基于微分方法的模式搜索匹配算法。该算法运用颜色直方图来描述目标运动窗口,并通过Bhattacharyya系数来衡量运动目标窗口与候选窗口的相似程度。通过相似度函数计算出位置偏移量来定位运动目标。每一步迭代过程都往相似度高的位置移动,直到算法最终收敛。该方法因其简单有效的特点在跟踪领域得到广泛的应用。初始运动目标的位置决定着跟踪定位的准确性和收敛能力,Fan等人将Meanshift算法转换成线性方程的求解问题,通过矩阵分析理论得到优化初始跟踪位置的方法,能够得到更有效的初始跟踪窗。Meanshift跟踪算法不包含运动目标的空间信息,当目标被遮挡,难以继续跟踪。Wang等人提出多子块Meanshift跟踪算法,在初始帧就将跟踪对象分割成数个有区分性的字块,推导出多子块Meanshift跟踪方法的位置偏移量,有效的解决了部分遮挡问题。近几年来在运动目标跟踪邻域比较常用的方法为卡尔曼滤波算法和粒子滤波算法。卡尔曼滤波跟踪方法作为概率跟踪方法最早应用于目标跟踪上。该方法是一种时域方法,它引入状态变量概念,将观测信息和动态系统分别用观测方程和状态方程描述,起初仅限于目标的观测方程和状态方程都是线性方程,并且噪声服从高斯分布情况下的运动目标跟踪,但实际应用场景中,观测方程和状态方程一般都是非线性的,且噪声服从非高斯分布,因此许多研究人员对卡尔曼滤波跟踪算法进行了改进。刘伟明等人将卡尔曼滤波和模板匹配相结合,实现运动车辆的复杂跟踪,取得了较好的跟踪效果;高璐提出了一种自适应卡尔曼滤波跟踪方法,它运用最小二乘支持向量机估计目标当前的运动模型;刘晓辉等人利用扩展卡尔曼滤波实现物体锁定技术,提出一种主动视觉和基于扩展卡尔曼滤波的物体跟踪系统;黎汉云和朱善安改进Hough变换提取眼角角点位置,提出了一种新的算法;李鹏和宋申民等利用高斯过程对训练数据进行学习得到的回归模型来代替观测方程和状态方程,提出了一种自适应无迹卡尔曼滤波算法。粒子滤波跟踪方法。粒子滤波(ParticleFilter,PF)是基于蒙特卡洛方法(MonteCarlomethods)和贝叶斯概率估计,它是通过粒子集来表示概率,在任何形式的状态空间模型上均适用。其核心思想是利用顺序重采样逼近后验复杂的概率分布,这种分布是由随机粒子来表达。为了解决非线性的状态方程、噪声是非高斯分布情况下和多态模型的目标跟踪,人们发现在这情况下运动的概率模型可以用于目标的跟踪,从而产生了粒子滤波目标跟踪方法。粒子滤波方法使用灵活、易实现且可并行处理,所以目前国内外对粒子滤波跟踪方法研究取得成果很多,但是同时该方法也有很多缺点,如采样点多、运算速度慢、计算量大等,很多问题还要更进一步的研究。6 南京邮电大学专业学位硕士研究生学位论文第一章绪论1.3行人检测研究难点虽然行人检测经历了二十多年的发展与积累,在算法与应用方面都取得了不错的成就,但是由于行人自身的多变性和背景的复杂性,在检测过程中还存在着许多技术难点,尚需继续研究。1.3.1准确性准确性是指在图片或者视频序列中能够检测出行人的精确程度,在实际应用场景中行人检测的准确性主要受以下几个方面的影响:1、行人自身的因素。一方面,行人千姿百态,单独一个行人可以从站姿变为蹲姿或者躺下,这些姿势的改变很容易致使监控系统中行人目标的丢失,影响着系统的准确性。另一方面,人们的着装也千差万别,比如带着帽子或者穿着长裙,这些服饰的差别也会造成行人检测系统的误判,造成漏检,严重影响系统的准确性2、行人背景的因素。当行人处在不同的环境中,背景复杂多变,尤其是背景中出现与人型相似的物体,比如树干、路边标志物等,都有可能造成检测系统的误判,另外若是行人服饰的颜色与背景色相近、光线的突变都会严重影响系统的准确性。3、动态遮挡的因素。在复杂场景中,行人在行走过程中不可避免的会出现遮挡问题,当行人被部分遮挡或者出现严重的遮挡情况下,机器是很难判别是否是行人,易造成漏检。4、拍摄的因素。一方面由于摄像机架设的位置不同,会出现对行人的拍摄角度的区别,当为俯视拍摄或者拍摄到的为行人的侧面时,就很难检测到行人,另一方面由于行人距离摄像机的距离的远近的不同,会出现目标太小或者太大的情况,太小会出现轮廓模糊,太大会只出现行人的部分身体,这些都会使行人检测系统的准确性下降。1.3.2实时性在实际应用中,行人检测系统对实时性的要求还是比较高的,同时具有较高精度和较快[11]的检测速度的行人检测系统实现起来还是有困难的。金字塔搜索检测算法,能达到较高的检测精度,但检测速度很慢,达不到实时;基于背景差法的简单行人检测系统表现出良好的实时性,但是精确度不高。综上所述,要想实现较高的准确性和较快的检测速度的实时行人检测系统,是一个比较7 南京邮电大学专业学位硕士研究生学位论文第一章绪论有挑战性的研究课题。1.4本文主要研究内容以及章节安排本研究主要是基于静态背景下视频图像序列中行人检测识别与跟踪的实现,针对如何准确、快速地检测出行人,重点研究了前景目标的快速检测与阴影的消除以及针对提取的分类特征维度较大的情况做了改进。在行人跟踪方面为了能够快速的跟踪行人并且能够在目标短暂发生遮挡的情况下不会跟丢目标,做了跟踪算法融合的改进,最后通过实验验证本研究实现的行人检测与跟踪系统是高效、可行的。各章具体安排如下:第一章:介绍了视频图像序列中行人检测的研究背景、国内外研究现状以及论文的研究工作和论文的组织安排。第二章:阐述了视频序列中前景运动目标检测与阴影消除的常用方法,重点介绍系统所运用的Vibe运动目标检测算法、快速归一化互相关阴影消除算法,并针对Vibe算法运用于目标检测时容易出现残影的不足,提出了与OTSU算法相结合的改进算法。第三章:主要研究了基于方向梯度直方图(HOG)特征进行人体目标的检测算法,并针对HOG特征维度较高,提出了基于主成分分析法对HOG特征进行特征降维,最后通过实验验证了改进算法的有效性。第四章:讲述了一些常见的目标跟踪的算法,重点研究了基于Camshift算法与Kalman滤波相结合的目标跟踪算法,通过实验表明,该改进算法提高了跟踪效率,并有效的解决的目标发生短暂遮挡或者跟踪目标与其他目标颜色相近所带来的干扰问题。第五章:设计并详细的介绍了利用前几章所提出的算法实现了一个基于视频图像序列的行人检测系统,并分析实验结果体现出本系统的优越性。第六章:总结与展望。总结本论文的优点与不足之处,并明确了今后研究方向。8 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除第二章前景目标的检测与阴影消除传统的基于HOG特征的行人检测算法,对视频序列中每一帧进行全局扫描计算其HOG特征,由于视频帧中存在大量的非行人区域,这样提取出的特征值含有大量的无关信息,存在冗余,同时也会使计算量的增加而导致检测速度的降低。利用视频序列的运动信息提取出运动目标区域,有针对性的对运动区域进行HOG特征提取,可以节省时间,提高精度。本章主要介绍运动目标提取的理论以及相关算法,主要包括运动目标的提取算法、阴影检测与消除算法。2.1运动物体检测运动目标检测,是指在一段视频中或者图像序列中把感兴趣的并且运动着的目标从静止的背景中标记出来。运动目标检测是分类识别和跟踪的前提,只有检测出运动目标,才能在运动目标区域运用行人检测方法判断是否为行人,并进行后续的跟踪处理。2.1.1帧差法[9-10]帧差法在运动目标检测与分割处理中经常被用到,它的原理非常简单,它基于图像序列中相邻帧之间具有较强的空间相关性。其基本原理为:在视频序列中相邻的两帧图像,时间间隔比较短,一般背景图像保持不变,所以在相同像素点上其灰度值也没有化;但是当有运动目标时,在运动目标经过的区域其位置上的像素点一定会发生变化,所以相应的会导致运动目标区域的灰度值也发生变化。因此,取任意的相邻两帧图像,对相应像素点的灰度值计算其绝对差值,然后将计算的结果与事先设定的阈值作比较,如果比设定的阈值大,就能确定此像素点前景运动目标的像素点;反之,如果小于设定的阈值,则认为此像素点为背景像素点,经过此处理后,则建立出背景图像。设Fk1(x,y)和Fk(x,y)分别为图像序列中连续的两帧图像,Dk(x,y)为二值化后两帧之间的差值图像,即:D(x,y)F(x,y)F(x,y)(2.1)kkk1如果光线或者其他条件没有变化,那么针对背景图像,则认为Dk(X,Y)的值等于零,对9 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除于运动目标区域,则有Dk(X,Y)的值不为零,对Dk(X,Y)进行二值化处理得到Rk(x,y)的值。1,foregroundDk(x,y)TRk(x,y)0,backgroundDk(x,y)T(2.2)其中阈值T的选择很重要,当Dk(X,Y)中的像素值小于给定阈值T时,则被判定为背景像素,反之,则认为是运动目标。采用这种方法即可得到运动目标区域的图像。其原理如下图所示:检测结果视频输入预预处处理理二值化形态学变换延迟图2.1帧差法流程图帧间差分算法的优点是实现简单,对光照变化不敏感,计算复杂度低。然而也有其不足之处,当运动目标区域内部的灰度比较一致时,采用这种方法往往只能够提取出运动目标的边缘轮廓,中间会出现空洞现象,使提取到的目标不完整。另外,根据帧差法的计算公式可知,当运动目标的运动比较缓慢时,这种方法能够得到与实际情况较为一致的运动目标,但如果运动目标的速度有较大变化时,会出现多检或者漏检的现象。如果改为多帧图像间接做差运算,则有可能得到大于实际目标的前景图,甚至有可能出现两个目标。[11-12]针对帧间差分法存在的缺点与不足,研究人员做了许多改进,文献提出了三帧图像差分法,即对连续的三帧图像除燥后分别做帧差处理。将第k帧与第K-1帧相减,得到二值图像D(x,y),将第k+1帧与第k帧相减,得到二值图像D(x,y),将D(x,y)和D(x,y)做与1212运算,最终得到三帧差图像D(x,y)。三帧差法利用了运动物体上像素的时间相关性,特别适合动态检测,同时能较好的抑制随机噪声。VSAM研究出了三帧差分与一种自适应背景减除[13]法结合,形成一种新的算法,该新算法能够快速的从背景图像中检测出运动目标,达到很好的检测效果。2.1.2光流法从视频或者图像序列中检测出运动目标物体、提取运动目标的相关特征值并且分析运动目标的运动特性是运动图像序列研究的主要内容,光流算法是一种基于运动目标像素点随时10 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除[14-15]间变化的光流特性进行目标检测的技术。光流能够体现出图像中像素点的变化,因此当有运动目标发生变化时,能够确定目标的运动情况。三维运动目标的实际运动称之为运动场,运动场在二维图像上的投影称之为光流场,光流其实就是空间中的运动物体在光流场中的像素的瞬时速度,因为从图像序列中直接得到运动场很困难,所以可以转化成对光流场的研究,在理想情况下二者相互吻合。如下图所示:平面图像VoP’pUP’pyzs光源x图2.2运动场与光流场光流是由运动目标和监控设备的运动产生的。其基本原理为:为图像中的像素点设定一个矢量值,这样就能得到整幅图像的光流场,当目标发生运动时,通过投影的方法可以得出每个像素点与三维物体上的点之间的对应关系,最后可根据各像素点的速度矢量特征来对图像进行动态分析。tt设在t时刻视频序列中像素点P(x,y)的速度矢量为V(v,v),灰度值为I(x,y,t),定在pxy较短的时间t内像素点P的灰度值没有发生变化,则有:I(x,y,t)I(xvt,yvt,tt)(2.3)xy等号的右边通过展开后可得:III2I(x,y,t)I(x,y,t)vvv(dt)(2.4)xytxyt由此可以得到光流法的等式为:IIIvvv0(2.5)xytxyt[10]最后通过结合其他的约束条件,如利用光滑全局平滑性的Hom-Schunck算法或者基于[17]最小二乘法的Lucas-Kanade算法,可以求出光流(v,v)。xy光流法的优点是即使在视频设备运动的情况下也能够检测出运动目标对象,并且不需要11 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除运动场景的其他信息。但是光流法也有其缺点,由于多光源、遮挡、阴影或者存在噪声,使得计算出的光流场不准确;而且大多数光流法计算复杂,借助高性能的硬件系统才能达到实时性的要求。2.1.3背景减法[18-19]背景减法指通过当前帧与提取的背景帧作差值运算,从而得到视频序列中运动轮廓的方法。所以背景减法的关键是背景图像的描述模型,即背景模型,只有建立了良好的背景模型,才能够正确的分割出前景目标。背景减法主要的研究问题为:(1)背景模型的提取:当场景中没有运动目标时,这时可以直接建立背景模型,这也是最简单直接的方法,但是当某些场合无法满足这种条件时,这个时候只能通过一定的帧数才能建立初始背景模型。(2)背景的扰动:实际应用场景中不可能总是存在绝对静止的背景,一般都包含晃动对象的干扰,如树叶、树枝随风摆动,这些干扰对象容易造成误检。(3)背景更新:由于光照变化、运动物体突然静止、静止的物体突然运动等因素的影响都会导致背景图像的变化,当这种情况发生时,需要及时的更新背景模型。背景减法是直接抽取视频序列中的某一帧或者某几帧的平均值作为背景。它的基本思想是:首先,对事先得到的图像序列的每个像素进行统计计算,得到背景模型B(x,y);其次,k将当前每一帧的图像F(x,y)与背景模型B(x,y)相减,将结果与给定的阈值相比较,当大于kk给定的阈值,则判定为运动目标,运用此方法能够得到运动物体的形状、位置等特征,从而得到较完整的运动目标信息。判定公式如下:1if(Fk(x,y)Bk(x,y)T(ThresholdValue))D(x,y)(2.6)k0Otherwise另外,随着环境的变化,还要对背景模型进行实时的更新,其基本流程如下:检测输出视频输入预处理二值化形态学处理背景图片背景更新图2.3背景减法流程图12 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除2.1.4基于改进Vibe算法的目标检测本节开始部分介绍了运动目标检测常用的三种检测方法,帧间差分法原理和算法实现简单,具有快速的特点,但是对于像素变化不太明显的前景点不敏感。光流法检测运动目标具有较高的准确性,但是计算量较大,很难做到对视频序列的实时处理,且对噪声不敏感。背景差分方法研究的重点在于背景建模与模型的更新,其中最具代表性的算法是基于参数的混合高斯模型,该算法常用在复杂运动场景的背景建模,但是该算法的缺点是初始化过程很长,[20]参数估计过慢,实时性较差。2009年OliverBarnich和MarcVanDroogenroeck在文献中提出了新的背景建模算法,并命名为Vibe(VisualBackgroundextractor)算法,该算法是一种像素级的背景建模、前景检测算法,它能够解决传统背景建模存在时间长、更新慢等问题。系统采取Vibe算法作为快速运动目标检测的方法,并针对Vibe算法存在在初始检测过程中可能出现残影的问题,结合最大类间差法(Otsu)对Vibe算法进行改进,达到快速消除鬼影的目的。接下来就详细介绍Vibe算法的实现原理以及改进过程。1.Vibe算法基本原理Vibe算法首次将邻域传播机制和随机选择机制应用于背景的建立与更新,是一种基于样本的建模法。Vibe算法主要包含三部分:背景建模、前景检测和背景模型更新。(1)背景模型的建立Vibe算法将第一帧作为背景模型,并为每个像素点建立样本集,所以Vibe的初始化过程就是填充像素样本集的过程。利用相近像素点具有相近的时空分布的特点弥补了在一帧图像中不可能包含像素点的时空分布信息的缺点,具体来说:对于图像中的每一个像素点,随机选择该像素点的邻域点的像素值作为它的样本值,建立一个大小为N的样本集M(x):M(x){v,v,...,v}(2.7)12N其中v表示背景像素值,N为采用邻域法时邻域的个数,系统中算法的实现采用八邻域方i法,即N=8,样本集M(x)的值由八邻域的值采用random函数随机产生,如下图所示:V(1)V(2)V(3)XXXV(4)VXV(5)XXV(6)V(7)V(7)XXX图2.4八邻域模型13 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除其中样本值v的表达式为:ivrandom{v(i)(i1,2,3,...,N)}(2.8)ix(2)前景检测判断像素点是否为前景像素点的依据是将当前的像素点与对应的背景像素点样本集中的样本值依次作比较,以此来衡量两者的相似程度。如下图所示:C2V1V3RV4vxV6SR(V(X))V5V2V7V8C1图2.5Vibe前景判断具体描述:在图像的欧式颜色空间中以v(x)为球心画一个半径为R的球体SR(v(x)),统计该点像素的背景样本集与球体相交的个数:#{S(v(x)){v,v,...,v}}(2.9)R12N#的值越大,说明该像素点为背景点的可能性就越大,设阈值为#min,当#>#min时,则当前像素点为背景点,否则为前景点。(3)背景模型更新Vibe算法中背景模型的更新即为背景像素点样本集的更新,算法中采用了保守更新策略+[21-22]前景点计数的方法,所谓前景点计数就是对每个像素点进行统计计数,假如一个像素点连续N次被检测为前景点,则认为该像素点被错误的判定为前景点,应将其更新为背景点。更新方法为:假如一个像素点被判别为背景点时,它有1/的概率更新它邻域像素点的模型样本值,同时也有1/的概率更新自身模型样本值。在选择要替换的样本集中的样本时,是随机的选取,这样能够保证样本值的平滑的生命周期,假设时间是连续的,那么在d时间后,t样本值仍然保留的概率为:Nln()dtp(t,tdt)eN1(2.10)这就表明一个样本值是否被替换与时间无关,随机策略是合适的。14 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除该方法也有一定的局限性,当视频的第一帧中包含运动目标时,运动目标区域也会被初始化为背景,这样在接下来的检测中会出现鬼影(Ghost)区域。传统的Vibe算法虽然也能达到消除鬼影的效果但是时间较长。系统采用将阈值分割算法(OTSU)与Vibe算法相融合,能够达到快速的消除出现的鬼影的效果。2.基于OTSU阈值的鬼影抑制为了快速抑制鬼影,在Vibe判别的基础上,加入了对前景像素点的二次判别。为了得到[23]二次判别的最佳阈值,引入了OTSU算法,它计算简单,不受对比度的影响。具体计算过程为:(1)计算最佳分割阈值:假设当前图像灰度值级为L,分割阈值为t,由此图像被分为前景和背景两部分,分别为灰度级为[0,t]的区域A和灰度级为[t+1,L-1]的区域B。定义类间方差:2222()()()(2.11)001010101其中,为前景像素点所占比例,平均灰度值为;为背景像素点所占比例,平均灰00122度值为;为整幅图像的灰度值。越大,说明两区域差别越大,更容易实现分割。当1取得最大值时所得的灰度值即得到最佳分割阈值:*2tArg[()](2.12)Max01010tL1(2)利用式(2.12)计算出的图像的阈值,可以将图像分割为两部分,但是无法判别出前景和背景,因此还需要借助原图像的信息。在已经由Vibe算法计算得到的背景像素点中随机的选取M个灰度值,统计计算这些灰度值的平均值,与最佳分割阈值进行比较,判别规则为:***v(x)t判为前景v(x)t判为前景ifvtf()xelsef()x(2.13)M**vx()t判为背景vx()t判为背景*当vt,说明背景像素点的灰度值的取值范围是[0,t*],因此若当前像素点的灰度值M*vt时,则将其判别为背景点,反之判别为前景点。当vt*时,说明背景像素点的灰度MM值的取值范围是[t*,L1],因此若当前像素点的灰度值v(x)t*时,则将其判别为背景点,反之判别为前景点。(3)对Vibe判别得到的前景像素点进行二次判别由步骤(2)已经确定了判别标准,对于Vibe算法得到的前景像素点,只需要进行二次判别即可,这样直接过滤掉了误判的鬼影像素点,随后需要对重新判别为背景的像素点对应的15 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除的背景模型进行更新,当然背景更新的范围也包括邻域内的像素点。为了验证本章算法鬼影抑制的效果,对于选取的视频序列分别采用Vibe算法以及改进的Vibe算法进行了运动行人的检测。实验结果如下所示:图2.6原始视频图像图2.7原始Vibe算法出现鬼影现象图2.8改进算法快速消除鬼影从实验结果可以看出,对于Pedestrian视频序列,在第21帧图像中,由Vibe算法检测行人时有许多残影存在,而Vibe与OTSU相结合的算法能够很好的消除大量的残影,检测到的前景目标也很完整。第58帧时,Vibe算法的检测结果仍然有残余的鬼影,直到第65帧以后,鬼影才能够基本消失,严重影响了前景目标检测的效果与速度,改进的Vibe算法检测效果较16 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除好。由此可以证明本系统的改进算法与原Vibe算法相比,能够在更少的帧数内完全抑制鬼影。2.2快速归一化互相关阴影检测与消除在运动目标检测过程中,由于光照等因素的影响,检测的运动目标往往会存在阴影,这对运动目标的特征提取会产生较大的影响,这会使多个目标融合到一起,也会使运动物体的轮廓发生变化,因此在进行分类检测行人之前对运动目标的阴影检测和消除显得尤为重要。阴影大致可分为投射阴影和自阴影。在有光照的情况下,物体被投影到背景图像上形成投射阴影;而自阴影是物体自身背光的一面,光线比较暗。由于运动物体的暗影与背景存在较大的差别,所以阴影也经常被误认为是运动目标。基于阴影的特性,研究人员提出常见的阴影检测方法,如HSV空间阴影检测法、基于阴影属性的阴影检测、快速归一化互相关(FNCC)阴影检测等。本系统采用快速归一化互相关系数进行阴影检测与消除,利用目标区域与阴影区域的亮度之间存在近似线性关系建立各像素点的互相关函数,并结合能量函数判定阴影区域。一般情况下,阴影都是因为太阳的照射产生的,像素点(x,y)的光照模型为:s(x,y)E(x,y)(x,y)(2.15)kkk其中s(x,y)为(像素点x,y)的亮度值,E(x,y)为运动物体单位面积受到的光照强度,kk(x,y)为反射系数。其中(x,y)随时间变化很小,可认为一常量,设为(x,y)。E(x,y)的kkk计算公式为:cAcpcos(N(x,y),L)无阴影Ek(x,y)cAk(x,y)cpcos(N(x,y),L)伴影(2.16)c暗影A其中c光源的亮度,c运动物体周围环境的亮度,L是光源到运动物体表面的方向矢量,pAN(x,y)是运动物体表面的法向量,k(x,y)是半影时光能的损失系数(0k(x,y)1),暗影时,光照强度为常量,即k(x,y)=0的情况。假设运动物体完全遮挡太阳光,则上式可简化为:cAcpcos(N(x,y),L)无阴影Ek(x,y)(2.17)c有阴影A像素点在未被阴影覆盖和被阴影覆盖时的亮度比值为:17 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除(cccos(N(x,y),L))(x,y)Apr(x,y)(2.18)c(x,y)A其中:cA,cp,cos(N(x,y),L)变化很缓慢,近似认为是常量,这种情况下,其亮度值呈现出线性关系。有概率知识可知,若两个随机变量存在线性关系,则相关系数为1。基于上述理论,若两个信号越相近,则归一化会互相关函数(NCC)越接近1。由以上分析可知利用NCC可进行阴影检测。假设视频序列中图像的尺寸为MN,B(x,y)为背景图像,C(x,y)为当前帧。定义以(x,y)为中心点、大小为(2L1)(2L1)的模板Tx,y(m,n)C(xm,yn),其中LmL,LnL,像素点(x,y)处的归一化互相关函数为:ER(x,y)NCC(x,y)(2.19)E(x,y)EBTx,y其中:LLER(x,y)B(xm,yn)Tx,y(m,n)(2.20)mLnLLL2EB(x,y)B(xm,yn)(2.21)mLnLLL2ETx,yTx,y(m,n)(2.22)mLnLET为模板能量函数,EB(x,y)为背景图像能量函数,假设C(x,y)被阴影覆盖,则有下式:x,yNCC(x,y)T(2.23)ncc其中,Tncc为一固定阈值,其值接近于1。若直接根据(2.19)式进行阴影检测,计算量较大,且T值越大复杂度越大,所以实时性x,y较差。采用一种快速互相关函数的计算方法,能够达到降低传统算法复杂度的目的。[24]快速互相关函数利用三个加总表对传统NCC计算公式进行改进。假设视频图像大小为MN,模板T的大小为(2L1)(2L1),对于像素点(x,y),B_square[x,y]为背景帧灰度值的平方,C_square[x,y]为当前帧灰度值的平方。BC_data[x,y]为(x,y)处当前帧与背景帧灰度值18 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除的乘积,B_square[x,y]的加总表为:SB_square[x,y]B_square[x,y]SB_square[x,y1](2.24)SB_square[x1,y]SB_square[x1,y1]同理,可以得到C_square[x,y]以及BC_data[x,y]的加总表,分别记为SC_square[x,y]以及SBC_data[x,y]。NCC计算公式中分母含有开方,计算时间会增加,将原公式开方,NCC(x,y)取值范不变,即在不改变检测效果的情况下降低了计算时间。最后得到FNCC的公式为:2ER(x,y)FNCC(x,y)(2.25)22E(x,y)EBTx,y其中:ER(x,y)S_BI(xL,yL)S_BI(xL1,yL)(2.26)S_BI(xL,yL1)S_BI(xL1,yL1)22EB(x,y)S_B(xL,yL)S_B(xL1,yL)(2.27)22S_B(xL,yL1)S_B(xL1,yL1)22ET(x,y)S_T(xL,yL)S_T(xL1,yL)(2.28)22S_T(xL,yL1)S_T(xL1,yL1)经过改进的快速归一化互相关函数算法,可以实时有效的对运动目标存在的阴影进行检测与消除。通过实验得知快速归一化互相关阴影检测与消除方法能够满足系统中运动目标的阴影检测与消除的要求,实验结果如下图所示:(a)原图(b)运动目标前景图(c)阴影检测与消除图2.9阴影检测与消除效果19 南京邮电大学专业学位硕士研究生学位论文第二章前景目标的检测与阴影消除2.3本章小结本章较详细的介绍了运动目标的检测与阴影检测与消除的处理过程。在各个模块中通过对常用算法进行简单的对比,提出了较为行之有效的解决办法。采用基于背景差分法原理提出的Vibe算法作为系统中运动目标的检测算法,并针对Vibe算法中存在的不足进行该井,提出结合OSTU阈值分割技术,在Vibe算法检测出前景目标的基于上进行二次检测,达到快速消除鬼影的目的。在进行阴影检测与消除模块,运用快速归一化互相关算法,达到快速检测阴影与消除的目的,从而提取出清晰的运动目标轮廓,为后续的行人检测提供良好的基础。20 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测第三章基于HOG-PCA特征的行人检测在上一章节中,对基于视频序列的运动目标检测与阴影消除做了详细的介绍并做了相关算法的改进,根据视频序列行人检测系统的设计步骤,本章将主要叙述运动目标的分类,也就是行人分类器的分析与设计。首先,通过常用的行人检测特征提取算法实验的结果比较,[25]说明本系统使用HOG特征作为特征提取算法,SVM作为分类器算法的缘由。并对HOG特征向量维度较大,实时性差的不足提出了改进算法,运用PCA降维方法对HOG特征进行[26]降维。接着,详细介绍本系统运用的方法,概述HOG特征的原理及提取过程、PCA特征降维算法和支持向量机分类器SVM进行分类的实现过程。最后。通过实验结果,阐述了本系统的优点。3.1行人特征提取的基本算法近几年来,行人检测的研究主要是基于统计学习算法的研究,取得了不错的成果,出现了许多优秀的算法,基于统计学习算法的行人检测的步骤一般分为图像或者视频序列的采集、图像预处理、运动行人分类识别、运动行人跟踪或者其他处理这几步,框架描述如下:图运像图训特动行或像练征人人视预分提体跟频处类取检踪采理器测集图3.1运动人体检测框架从流程图中可知,在图像或者视频的采集时,由于器材或者拍摄的场景不同会影响到图像的采集效果。而且图像的传感器、拍摄场景中光源的选择等都会对行人的检测的结果产生一定的影响,本研究所考虑的视频序列的选取主要是背景固定的监控视频,由于天气、时间段的变化会产生光照的变化,在特征选取上要选取对光照变化不敏感的特征。图像的预处理主要包含视频的编解码和图像的处理,其中图像处理主要包括图像的滤波用以消除噪声、图像的分割处理、形态学变换以及连通性分析等,主要是为了更好的进行行人的检测与跟踪。在行人检测流程中,最重要的是特征的提取、分类器的训练和行人识别。其中特征提取最为关键,好的特征更能够全面的表征人体的各部位信息,更能够很好的区分行人与其他物21 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测体,在行人检测研究初期,专家学者往往是通过行人的简单特征进行分类检测,如颜色、宽高比、形状面积等,然后送入神经网络进行学习。这些简单特征能够在一定程度上提高检测效率,但是准确率太差,因为行人的姿态千差万别、高矮胖瘦、着装各异,单独使用这些简单的特征普适性太差。在基于统计学习算法进行行人检测时,常用的特征有:1.Harr-like特征[30]Harr-like是由Harr小波特征得到。由于Harr-like计算速度很快,特别适合对计算速度要求高的检测算法中,因此经常用此方法进行人脸检测。Harr小波函数最早用于计算平方可积的函数,后来发展为机器错误监视、电力系统分析、图像压缩等领域。Harr小波的母小波方程为:11if0t21(t)1ift1(3.1)20otherwise缩放方程定义为:1if0t1(t)(3.2)0otherwiseHarr小波实现简单、计算量小,在简单的分类器中经常被用到。2.edgelet特征人体的边缘特征在所有特征中最为能够明显的表征人体,但是由于人高矮胖瘦和身高千差万别,姿态各异,如何才能有效的利用人体的边缘特征并能够适应人体形态的变化是研究人员所要面临的问题。BoWu在文献[31]中提出了edgelet,由于edgelet是一小段直线或者曲线,长度在8到12个像素,所以相比于整体模板edgelet更具有普适性。通过结合使用boosting算法和edgelet特征,从而得到高效的edgelet。为了获取检测目标可以使用图像中与edgelet形状相匹配的响应值大于某一固定阈值的位置。Edgelet特征存在几个优点,首先,由于edgelet只是计算某一小部分区域,因此计算速度很快而且计算量也较少;其次,因为要计算的edgelet图片是在sobel算子算出的边缘上进行的,从而可以减少光照的影响;最后,由于物体的方向信息存在于edgelet中,从而可以避免由于形状相似而产生的错误匹配。但是Edgelet也存在不足,edgelet必须要人工设置,然后再通过boostiing筛选出最优的edgelet,但是毕竟最优值是在人工设定下完成的,因此无法完美契合。所以最佳的方法是自适应的edgelet。后来Sabzmeydani提出shapelet特征,该特22 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测征可以通过机器学习获取,能很好的贴近目标的轮廓,能够更好的检测出目标。3.LBP特征[31]Ojala在文献中最先提出LBP(LocalBinaryPattern)算法,该纹理特征能够很好的描述图像。LBP计算较为简便,并且能够得到很好的效果,因此该特征得到非常广泛的使用。基本的LBP特征是将整幅图划分为3x3的窗口,以中心像素的灰度值为参考,四周的像素点的灰度值与其比较,大于此值则设置为1,小于则设置为0。基本LocalBinaryPattern通过与直方图共同使用来对目标物体进行检测,但是这样实时性较差,而且容易增加运算的复杂度。后来研究人员在这个基础上进行了算法的改进,提出了Fourier-LBP与Semantic-LBP算法,这些算法在某种程度上解决了上述LocalBinaryPattern算法存在的缺点。4.HOG特征[25]HOG检测方法在2005年被首次提出,旨在通过基于边缘的方向来检测目标。在HOG检测方法提出之后,大量使用在视频序列中的行人检测、行人在静态图像中的检测与车辆的检测等物体的分类检测,与其他的特征描述方法相比,HOG特征描述具有很多优点,本系统也是基于HOG特征对行人进行检测,这里只是提及,后面会对HOG特征进行详细的介绍。3.2行人分类的基本算法行人检测性能的优劣的另一重要的因素在于分类器的选择,分类的好坏取决去选择何种分类策略,好的分类算法能够达到较快的分类速度和较高准确度。一般情况下,对目标的分类主要是采用“学习”的理论进行的,所以分类问题其实就是学习问题。通过对训练样本集中的样本信息进行学习理解从而找出训练样本所包含的规律是学习的主要目的,结果以函数的形式表述。下面就简单介绍常见的分类学习算法。3.2.1神经网络分类算法[34]神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法及数学模型。神经网络可以根据不同复杂程度的系统,相应的调整内部不同节点之间连接的状态来改变节点之间的连接关系,以此达到处理信息的目的。神经网络是一种自适应的非线性系统,它是由许多神经元相互连接而成。神经网络有两种结构形式,一种是有向图的拓扑结构,另一种为模拟大脑中神经元的结构。神经网络包含许多的处理节点,通过这些处理节点之间的相互交流可以传输信息。神经23 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测网络连接过程可以通过从训练样本集中训练得到的权重来维持。每个节点对输入的值进行评估并统计计算出总的输入值,将总的输入值与设定的阈值作比较,以此判定最终的输出。神经网络的学习过程即为权重矩阵的变化过程。BP神经网络和RBF神经网络是目前较为常用的用于分类处理的两种神经网络。BP网络为前馈神经网络,它由一个输出层、一个输入层和一个或多个隐层组成。一般情况下将sigmoid函数作为隐层节点的函数。RBP网络与由三层组成:输入层、隐层和输出层。它的特点是各个处理节点之间全部连接,是完全的前馈神经网络。因为神经网络不能够对小类赋予恰当的权值,所以BP和RBP对非平衡数据集的分类表现不佳。3.2.2决策树分类器[33]决策树使用简单的知识表示对样本进行分类。在一个典型的决策树中,树节点表示属性,边表示对于某个特定属性可能的值,叶节点标上类别标签。当一棵决策树建立后,对测试样本的分类是直截了当的。从根节点开始,根据属性值选择哪条边,知道叶节点,就完成了分类。常用到的决策树算法有ID3、C4.5和CART。决策树分类器由两部分构成:树的构建和剪枝。在构建阶段,根据局部最优准则递归地将训练数据分割到各自对应的类别中,知道无法继续分割了位置。在构建完决策树后,需要进行树的剪枝来减少决策树的大小。剪枝操作尝试通过修建原始树的分支来提高决策树的泛化能力。决策树的剪枝操作是基于错误的,从树的根节点然后检查每个非叶分支。如果这个分支能用一个叶节点,或者其最常用的一枝,来代替并能降低预测错误率的话,就进行剪枝。当构建决策树时,通过检查叶节点下的训练集,并选择最常用的一类来给叶节点加上类别标签。由于容易出现分类不平衡问题,决策树需要很多的测试将小类从大类中区分出来。在一些学习过程中,分裂过程可能在预测出更小的类别前就终止了,这容易造成视界局限。在还有一些学习过程中,先是进行完全的分裂,然后对其进行剪枝。同由于分裂过多导致的错误率增长相比,从很多小类中正确的预测出一小部分相对应的样本来减少的错误率显得微不足道,所以还是要进行剪枝。通过基于预测错误的剪枝,一些预测小类的分支被剪掉,然后用新的带有主要类别标签的叶节点来代替。由于C4.5是一个相对比较出名的决策树分类系统,许多分类不平衡的研究是基于C4.5上进行的。24 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测3.2.3贝叶斯分类器贝叶斯分类是基于概率图模型的推论,在使用图结构的模型下带有了概率注释。其最简单的结构,一个概率图模型,其中节点表示随机变量,弧表示节点间概率相依。无向图模型称为Markov网络,而有向图模型称为贝叶斯网络。一旦概率的神经网络构建成功,就能通过一系列的观察得到一个事件的发生概率。[35]朴素贝叶斯分类假设属性独立影响。当假设令人满意时,进行计算并放弃最优分类器。但是,在实际中属性独立影响是很难满足的。从数据中进行贝叶斯网络的学习可以分为参数学习和结构学习,后者更难一点。最近,有关键性突破使得有方法能够直接从数据库中学习到图模型中的结构和参数。学习一个概率模型的关键在于找到一个与给定训练集最匹配的网络。发现属性间的相互依赖关系,即一个完整的图,图中每个属性都和其他属性相连接,这当然是最好的。然而,这样的网络并不能给出关于任何有用的独立表示。因此,通过使用评分函数来逼近依赖模式。显然,对于一个非平衡的数据集,小类别固有的依赖模式一般是不够显著的,难以在网络中得到足够的编码。当学习好的网络用来进行分类推测时,小类别中的样本常常被错分类。3.2.4SVM分类算法[36]支持向量机由Vapnik提出的基于最大分类间隔的一种线性分类器。原始的SVM是通过分类间隔进行两种类别之间的分类,其中分类间隔表示距离超平面最近的点到超平面的距离。SVM寻找一个最优分割超平面,使得分类间隔最大化。如何获取这个最优超平面,需要依靠产生分类间隔的点集。这些点集称为支持向量。当非线性分割问题通过使用一系列非线性基本函数来转换到高维特征空间时,就可以使用线性SVM来进行分类了。然而,在可能的高维特征空间中支持向量机并不是一定要进行这种转换来确定超平面的。那该怎么做呢?这边引入核这个概念,通过对支持向量使用某个核函数来得到权值。这一步中核函数是关键。常使用的有高斯径向基函数和多项式核函数。当要实现完美分割不可能时,引入松弛变量来忽略某些独特向量,使得最大化分类间隔并最小化错误率。SVM的优点有很多,简单高效,且无需先验知识。但是SVM分类效果的好坏与核函数有很大关系,因为现在还没有研究出如何自动选择最有效的核函数,暂时只能凭经验和实验来选择核函数,而核函数的匹配度与SVM分类效果有本质上的关系。25 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测3.3HOG-PCA特征的理论基础2005年两位法国国家计算机技术和控制研究所(INRIA)的研究者NavneetDalal和BillTriggs在CVPR2005上发表的论文HistogramsoforientedGradientsforHumanDetection中首次[25]提出基于HOG的行人检测方法,该检测方法是对图像中的某一局部区域梯度方向出现的次数进行的一个统计,类似于边缘方向直方图(EdgeOrientationHistograms)方法。在本篇发表的论文中作者结合SVM分类器进行行人检测取得了很好的效果,之后的许多相关研究都是HOG特征或者此思想展开的。利用HOG+SVM算法对多幅图片进行测试。同时,利用Harr+Adaboost算法对多幅图片进行测试。表3.1为两种算法对分辨率大小为640480的图片的检测时间的对比:表3.1Haar+Adaboost和HOG+SVM检测时间对比检测方法检测时间测试图片大小SVM+HOG1294ms640480Adaboost+Haar438ms640480通过检测时间的对比,得出HOG+SVM算法能够检测出大部分行人,在行人发生遮挡时存在漏检的情况,当行人着装与背景颜色很相近时存在误检。在测试过程中发现,当测试图片测尺寸增大时,检测时间会快速增加,虽然在分辨率为64128的图片的检测时间只需60ms,但是在检测分辨率为640480的图片时检测时间却达到了1.4s,如果将此方法直接运用到视频序列中进行行人检测,那么可想而知,很难达到实时性的要求。在文献中Dalal运用检测窗口数N值为3285个,检测窗口为64128、移动步长为8像素对一幅640480的图像进行检测,每个检测窗口的HOG特征维数达到3780维,这样以来总共要计算几千万维特征才能遍历整幅图片。于此方法比较,虽然Adaboost+Haar算法检测效果稍差,由于Adaboost算法增加了若干强分类器并且通过几级分类器排除很大的区域,因此很大的提升了检测速度。在设计的行人检测与跟踪系统中,由于是先将视频序列中的运动目标检测出来再进行分类,所以就不存在排除许多非行人区域的步骤。基于HOG特征存在检测效果好但是维度较高实时性差的特点,选用HOG作为特征提取算法,SVM作为分类器算法,但是需要改进,理由如下:1.由于采用滑动窗口对图片进行HOG特征提取,并且采用了金字塔模式进行了缩放检测,所以提取出的HOG特征维度较高,并且随着图像像素的增加,特征向量维度会快速增长,这样会严重影响行人检测的实时性。针对HOG的这一不足之处,有学者提出运用GPU26 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测[16]进行硬件方面的加速,在一定程度度上提高了检测速度。本系统在视频序列行人检测当中先进行运动目标的提取,这样就排除了大量无关信息区域,并且对运动目标进行了标记,只对新进场的目标进行运动目标分类判别,使检测速度得到了大大的提高。2.当行人目标发生遮挡或者目标着装与背景颜色很近时,容易发生漏检或者误检的情况,可考虑将多种特征进行融合以达到提高检测率的目的,如文献中提到的HOG-LBP特征,但这势必会造成检测时间的进一步增加,本系统主要目的是要建立一个实时性较好、准确性能满足实际需求的行人检测系统,兼顾两者的平衡,所以系统主要考虑在单一特征上做进一步改进,3.在进行HOG特征提取时由于本身的提取思想,会有许多重复的计算,在高纬度的特征向量当中,必然会存在大量的冗余信息,用特征降维的思想,对特征向量进行选择,提取出最有用的信息,这不仅能够增加分类精度,还能够使检测时间明显的降低。LDA和PCA是在研究行人检测中较为常用的特征降维方法。系统中主要是利用PCA降维方法对HOG特征进行降维。4.本系统主要是分辨出视频序列中行人和其他物体,进行分类判别的区域为运动物体区域,行人有很大可能存在于这些区域中。像Adaboost这样的级联分类器的一般是先经过弱分类器的快速算法来分辨非行人区域,最后通过联合判别。SVM分类器在本系统中便能满足要求。因此本行人检测系统采用SVM分类器,只需要训练出最优的SVM行人分类器。因此,根据本行人检测系统的设计思路,在行人分类判别部分提出以下算法:提取运动目标矩形区域的HOG特征作为初始特征,通过PCA进行特征降维,寻找最优子集,并最终送入到训练好的最优SVM分类器进行分类判别,标记运动目标是否为行人。下面就详细介绍HOG特征提取过程和PCA降维原理。3.3.1HOG特征基本原理HOG特征属密集型特征,特征维度较高。HOG算法的基本原理是在一张图像中,局部目标的形状和表象可以由边缘的方向密度分布或梯度很好的描述。1.HOG特征提取流程HOG特征的基本算法流程为:将一幅图片以像素为单位划分为一个个小的细胞单元(cell),如大小为88像素/cell,然后统计每个细胞单元上的梯度方向直方图,并通过投影得到9维的特征向量,也就是在每个细胞单元上的特征描述;将每个细胞单元组成一个大的区域,比如22cell/block,block的HOG特征可以通过该block内的所有特征描述串联来表述,最终27 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测供分类使用的特征向量就是这样获得的。HOG特征的提取与计算主要包括空间插值投影、梯度块内归一化梯度直方图、标准化gamma空间和颜色空间、高斯加权、计算图像以及收集HOG特征向量。具体算法流程如下图所示:检测窗口归一化图像计算梯度对于每一个cell块对梯度直方图进行规定权重的投影对于每一个重叠Block块内的cell进行对比度归一化把所有Block内的直方图向量一起组合成一特征向量f={x1,x2,„,xn}个大的HOG特征向量图3.2特征提取算法2.HOG特征的提取图像在像素点(x,y)处的HOG特征计算公式为:22A(x,y)d(x,y)d(x,y)(3.3)xy1dy(x,y)tan,dx(x,y)0&dy(x,y)0d(x,y)x1dy(x,y)x,ytan,dx(x,y)0&dy(x,y)0(3.4)d(x,y)x1dy(x,y)tan,othersdx(x,y)其中,d为像素点在水平方向上的梯度值,d为像素点在垂直方向上的梯度值,A(x,y)xy为该像素点的梯度幅值,梯度方向为上式中的(x,y)。式3.4中(x,y)的取值区间是[0,)。梯度计算算子一般含有一维算子和二维算子,计算公式如下:一维算子:[1,1],[1,0,1],[1,8,0,8,1](3.5)28 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测1001二维算子:d,d(3.6)x01y10文献[23]中已经测试验证了上述各算子,通过测试结果得到一维算子的最佳实验效果为[-1,0,1],因此本系统也采用了这种[-1,0,1]来提取梯度特征。设像素点(x,y)的像素值为I(x,y),则梯度分量d,d的计算公式如下:xyd(x,y)I(x1,y)I(x1,y)x(3.7)d(x,y)I(x,y1)I(x,y1)y因为颜色信息作用不大,通常会先运用Gamma压缩公式将图像转化成灰度图,转化公式如下:gammaI(x,y)I(x,y),gamma1/2(3.8)3.高斯权重调整根据高斯权重理论,一般在某个区域内,各个位置所对区域的贡献是各异的。距离中心位置越近的像素点的贡献值越大,反之,则越低。高斯权重主要表现在像素位置的偏向性,像素点处于区域中心则更能表达该区域信息的变化。可以可利用此理论对梯度幅值进行调整从而来完成对每个cell中的HOG特征提取。图3.5为一个大小为1616的Block块,包含4个cell,用不同颜色标出,每个cell内的数值为梯度幅值的权重。离Block中心越近的权值越大,反之则越小。高斯权值示意图见图3.5所示图3.3高斯权值4.空间梯度插值投影29 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测0在进行梯度方向的额统计时,将方向的范围限制在[0,180)之间,并将该范围平均分成9个区域,通过式3.4计算出每个像素点的方向和幅值,然后根据这些像素点的梯度方向值统计叠加每个区域的梯度幅值,这种做法实现简单,但是实际情况是并不是每个像素点的梯度o方向都恰好在某个区域的正中央,例如某个像素点的放心角为40.2,它落在[40,60)的区域内,但是是并不能忽视它对临近区域[20,40)的梯度幅值的影响。所以,更合理的解决办法是对梯度幅值进行相邻区域的投影,利用投影算法,将投影各像素点的梯度方向到相邻的两个区域中心,进而再进行叠加在这两个相邻的区域内的梯度幅值。具体投影如下图所示:(a)梯度投影方向(b)投影到相邻区域图3.4梯度方向幅值投影文献[26]采用的是积分图的方式进行梯度幅值的叠加,并没有运用高斯权重进行调整,这样做虽能够缩短HOG特征的提取时间,但是却降低了HOG特征的描述能力。5.归一化权重及生成特征向量提高检测器对光照的鲁棒性是归一化图像的主要目的,因为各个不同的场所都可能出现人体的实际目标,对光照不太敏感的区域检测器必须要有好的效果。HOG特征是组合由训练样本中每一个Block的特征而形成,由于像素点的梯度在某些局部区域具有剧烈的变化,则会导致该像素点所在的Block的特征幅值变大,造成了不同的Block的特征值差距很大。根据统计学理论,将导致分类能力在特征值差别很大的情况下降。解决办法是以Block为单位,然后归一化处理每个Block中的HOG特征,最后再组合在一起最终生成图片的特征向量。下式是一些常用的归一化方式:2L2-Norm:vv/||v||2(3.9)2L2-Hys:vmax(v/||v||,)(3.10)2L1-Norm:vv/||v||1(3.11)2L1-Sqrt:vv/||v||1(3.12)30 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测根据文献[23]中原作者给出的实验结果,系统中归一化处理是通过L2-Norm进行,为了防止分母为零,取0.25。若将样本分成1616的Block,每个Block分成4个大小为88的cell,将每个Block的特征组合起来,最终每个样本的HOG特征值将达到3780维。3.3.2主成份分析算法(PCA)原理主成分分析算法简称PCA是一种简单有效的降维方法,经常被用于进行降维统计特征,其基本原理是通过空间变换,将原来的样本空间的坐标投影到维度更低的坐标空间,且这个新的坐标空间相互正交。将维度较高的原始数据通过投影,转化为维度较低的投影变量,这些变量能够尽可能的表达原变量中的信息,且这些变量互不影响,这就达到了降维的目的。通过对PCA的原理分析可知,PCA降维算法主要的任务是设法通过各种变换得到一组互不相关的变量,这些投影变量能够代表原始的特征向量。假设将选取的线性组合依次记为F,F,...F,根据特征降维的思想可知,投影变量越靠前,越能够较多的反映出原始信息,信12P息的测量标度一般用方差表示,记为Var(F1)。如果F1包含原始的信息越多,说明Var(F1)值越大。从而第一主成分即为方差最大的线性组合。一般情况下要求90%以上的原始信息能够包含于所求得的主成分。如果第一主成分不能达到要求,那么就继续选取第二主成分,也就是方差第二大的投影变量,以此类推,直到找到满足要求的前P个主成分分量。对于一个样本,观测P个变量x1,x2,...,xp,n个样本的数据矩阵为:x11x12...x1pxx...x21222pXx,x...,xp(3.13)12,............xn1xn2...xnpx1jx2j其中:xj,j1,2...,pxnjPCA的主要任务就是将P个观测变量投影到P个新的线性变量,即:F1a11x1a12x2...a1pxpF2a21x1a22x2...a2pxp(3.14)...Faxax...axpp11p22ppp简写为:31 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测Faxax...axj1,2,...,p(3.15)jj11j22jpp要求模型应满足一下条件:1.F,F互不相关(ij,i,j1,2,..,p)。ij2.F,F,...,F的方差依次减小。12P2223.aa...a1k1,2,...,p。k1k2kp其中a为主成分分量系数,F为具有最大方差的第一主成分,P为主成分个数。ij1一般地,特征主成分的计算公式为:TyU(xx)(3.16)iT其中y为前P个主成分特征,U为协方差矩阵,由下式定义,x为需要降维的特征,x为i样本的特征均值。NT1TU(xix)(xix)(3.17)Nn1本系统运用PCA降维方法对HOG特征进行降维,形成新的HOG-PCA特征来描述行人主要原因是:1.HOG特征维度较高,整幅检测图像中并不是每个像素点都包含对行人分类有用的信息,这样直接提取出的原始HOG特征存在大量的冗余。2.分类的目标是使类间距离尽可能的大,而类内距离尽可能的小,PCA能达到增加类间分类距离的效果。3.通过PCA算法对原始特征进行线性变换,得到方差较大的特征向量的线性组合,因此可以达到冗余降低维度去除的目的,特征向量维度的降低能够分类的进行。3.4基于HOG-PCA特征的行人检测在上一节中我们详细介绍的HOG算法原理以及实现过程,针对HOG维度过高存在大量冗余信息的缺点,提出的基于PCA算法对HOG特征进行特征降维。为了对基本的HOG特征和改进的HOG-PCA特征进行性能的比较,本节将详细介绍实验的过程,通过实验结果的比较,验证改进算法的可行性和优越性。32 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测3.4.1行人检测样本集[25]在进行分类器的训练时需要大量的训练样本,采用目前应用最为广泛的INRIA行人数据库,该行人数据库是由法国国家信息与自动化研究所提供的,该数据库包含具有各种姿势和背景的行人图片,训练集中包含正样本614张,负样本121张;测试集中包含正样本288张,负样本453张。数据库训练文件夹下共有正样本2416张,大小为:96160,HOG特征提取是直接通过64128的检测窗大小进行的,维度的大小将会达到三万多维,所以需要对这些样本进行处理。图片采用将96160的正样本进行缩放处理,缩放后的大小为64128,正好符合检测窗口的要求。通过对训练和测试负样本中的每一幅图片进行随机裁剪成10张大小为64128的子图片,最后得到12180张训练负样本,4530张测试负样本。这些负样本包含街道、动物、草地与河流等丰富的背景图片。通过以上的处理,行人检测分类器的训练及测试样本就制作完成了,最终得到的训练及测试样本数量如下图所示:表3.2INRIA数据库训练集INRIA数据库样本负样本正样本训练样本121802416测试样本45301126为了能够获得正负训练样本比的最优值,系统中训练样本集是通过交叉验证的思想构建的。首先,将训练负样本分成五组。每组2436张,分别标记为1,2,3,4,5组。接下来将正样本与第1组作为初始训练样本,送入SVM进行分类训练得到分类器。用第2组进行测试,此时检测出的矩形区域很显然是误检,将这些误检区域制作成样本,称为困难样本,加入到负样本中,重新训练。用同样的方法测试3、4组负样本,最终的训练样本是通过训练样本中加入困难样本得到。第5组同样作为负样本测试集。3.4.2基于HOG特征的行人检测根据前文所述HOG特征的提取过程:每个cell大小为88个像素,每个Block为22个cell,步长为8个像素。由于训练时将训练样本的大小统一为64128,所以每一幅样本图像提取的HOG特征均为3780维。分类器训练及测试流程为:33 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测训练样本集提取HOG特征SVM分类器1测试样本集提取HOG特征SVM分类器2图3.5基本HOG特征行人分类器训练、测试流程图具体步骤如下:(1)提取初始训练样本集中所有样本的HOG特征向量。(2)将特征向量举证送入SVM分类器中进行训练,得到初始行人分类器。(3)根据文中前述中提到的交叉训练的思想进行分组训练,最终得到最优分类器。(4)提取测试样本集中样本图片的HOG特征,送入由第(3)步得到的分类器进行测试,验证分类器分类效果。检测分类效果的指标一般为:TPTN(1)检测率:TPFPFNTNFN(2)漏报率:TPFNFP(3)虚警率:FPTN最终测试结果为:表3.3基于HOG特征分类器的测试识别率样本集判为正样本判为负样本检测率平均检测率正样本(1126)10868092.6%92.15%负样本(4530)360433991.7%3.4.3基于HOG-PCA特征的行人检测从上一小节中介绍的HOG特征的原理以及提取过程可知,对于大小为64128的图像提取出的HOG特征也高达3481维,其实行人的有效的信息只是存在于边缘梯度上,这么高的维度必然会包含大量的无用信息,严重影响检测速度。只保存HOG特征的有用特征向量,去除无用的特征值,在理论上能够在不降低检测效果的情况下达到提高检测速度的目的。研究设计的改进的HOG特征行人检测分类器的主要是将初始得到训练样本的HOG特征经过PCA进行降维处理,得到新的HOG-PCA特征向量之后,再送入SVM分类器进行分类训练,34 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测其训练流程图如下:训练样本集HOG特征提取PCA降维HOG-PCA特征SVM分类器图3.6HOG-PCA特征训练流程图根据对比试验的基本准则,本系统使用同一训练样本集进行训练测试,具体步骤为:(1)计算训练样本集中所有样本图片的HOG特征,每个样本会得到一个维度为3780维的HOG特征向量。(2)根据样本的HOG特征向量和样本均值,根据式(3-12)计算出特征值、特征向量和协方差矩阵U,U矩阵的大小为37803780。(3)取协方差矩阵的前p个主成分,通过式(3-11)对每一个训练样本的HOG特征进行降维处理,得到维度为P维的HOG-PCA特征。(4)将新的P维HOG-PCA特征送入SVM中进行训练,得到初始行人分类器。(5)通过交叉实验得到最终的行人检测分类器。需要说明的是主成分维度P是在实验中不断调整得到的。实验的目的是分析保留不同组成分的个数对于HOG描述符的影响,样本的维数应与样本中的区间数成正比,分别对应保留500维、400维,300维,...,50维,20维主成分进行实验,本实验依然采用的是INRIA数据库作为实验样本库。INRIA数据库的行人样本1350个;采用的训练分类器为SVM线性分类器。衡量行人检测模型的两个重要指标为识别率和识别速度,考虑到PCA降维处理也会花费时间,本实验综合考虑降维时间和分类识别时间。对于基于PCA对HOG特征进行的降维方法,本系统采用在满足最低识别率的前提下选择能够满足最短识别时间的维度。最终实验结果如表3.4所示。由实验结果可知,主成分的个数不同得到检测率也不同,随着主成分的个数增加,识别率也相应的增加,当主成分取300时总体识别率达到最高的94.27%,当主成分个数再次增加时,识别率不增反降,这说明通过PCA进行降维,选取一定数量的特征子集能够在一定程度上提高分类器的识别率。35 南京邮电大学专业学位硕士研究生学位论文第三章基于HOG-PCA特征的行人检测表3.4HOG-PCA特征实验结果测试集识别率(%)序号主成分个数支持向量数测试正样本测试负样本总识别率12064693.0796.7392.9025047194.7595.5693.10310048094.4896.4893.48420050895.9196.2894.09530057096.0396.5194.27640061995.3295.8793.60750065394.8495.3193.07针对基本的HOG特征分类器和改进的HOG-PCA特征分类器,在P=300的情况下,对数据库样本即进行训练测试,实验结果表明对于大小为70134的单幅图片,HOG-SVM分类器的检测时间大约需要134ms的分类时间,而HOG-PCA-SVM分类器的检测时间大约只需要60ms的检测时间。这说明运用PCA算法对HOG特征进行降维处理,不仅能够带来识别率的提高,也使得检测时间大大缩短。3.5本章小结本章主要研究行人检测分类的方法,通过比较实验得出HOG特征提取算法在行人检测方面的优越性能,并针对HOG特征维度较高,检测速度慢的缺点进行改进,通过对比实验得出系统运用的HOG+PCA特征在行人检测分类方面具有较高的分类精度和较快的检测时间。36 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪第四章Camshift与Kalman相结合的行人跟踪众所周知一个完整的行人检测系统不仅要有人体检测部分,也应该包含行人跟踪的模块,这不仅提高了行人检测的准确性,也可作为后续行人的行为分析的先期处理。前三章主要分析与介绍了行人检测的算法实现,本章主要讲述行人的跟踪部分。跟踪其实就是在图像序列中找出同一个运动的人体目标在每一帧中的位置范围,以此得到人体的运动轨迹。4.1人体运动目标跟踪的基本方法常用的运动行人目标跟踪方法主要有两种,分别是通过特征识别跟踪和通过运动状态信息跟踪。前者主要通过提取运动行人图像的灰度、边缘、颜色等特征,这些特征在运动过程中相对比较稳定,可以有效的减少光照、遮挡等因素的影响;后者主要是通过根据运动行人状态信息预测行人在下一帧的位置,根据帧与帧之间的位置关联性实现跟踪。4.1.1基于运动状态信息的目标跟踪基于运动状态信息的目标跟踪主要有光流法、Meanshift算法、卡尔曼滤波法、蒙特克罗算法等。下面简单介绍如下:(1)光流法。通常情况下,监控设备的运动和场景中前景目标本身的运动或者两者同时移动时都会有光流产生。光流法的假设前提包括相邻帧之间的亮度恒定、相邻帧之间物体的运动比较微小和相同子图中的像素点的运动轨迹是相同的。目标跟踪中使用光流的基本思路是:在给定的一个不间断的视频帧序列,找出前景运动目标具有代表性的关键特征点,然后在相邻的任意两个视频帧中,寻找当前帧中的前一个帧关键特征点的最佳位置,计算出在当前帧中前景目标的位置点,依次循环迭代实现对目标的跟踪。使用该方法计算出的结果容易受到外界因素的干扰而产生误差,该算法的缺点是实时性差,计算复杂度高。(2)MeanShift算法。MeanShift算法使用的搜索特征是目标的颜色直方图,不断迭代MeanShift向量让它收敛于目标的真实位置,实现对目标的跟踪。该算法计算量小,在目标区域已知的情况下可以达到实时的要求,并且采用核函数直方图对边缘遮挡、形变、目标旋转和背景运动不敏感。但是该方法也存在诸如缺乏必要的模板更新、不能适应目标的尺度变化和直方图特征缺乏空间信息等缺点。(3)卡尔曼滤波算法。最优化自回归数据处理算法是该算法的核心部分,在实际应用中,37 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪虽然性能高效,但是现实中不再适用非线性情况Kalman滤波器和非高斯的场景,后来又提出了扩展卡尔曼滤波器来处理这些情况。(4)蒙特卡罗算法。蒙特卡罗算法(粒子滤波器)能够解决非高斯、非线性问题,是一[29]种通过蒙特卡罗仿真递归的执行贝叶斯滤波的算法。为了更加接近系统的后验概率密度,需要增加样本的数量,但是当图像序列中被跟踪的运动目标数量增加时,该算法的复杂度也会成倍增加,甚至会发生粒子样本退化的现象,从而无法保证系统的实时性和可靠性。上述介绍的为常见的运动目标的跟踪算法,各有其优缺点,有时为了达到特定的效果,可以联合使用上述算法达到取长补短的目的。4.2基于卡尔曼滤波的人体运动目标跟踪4.2.1卡尔曼滤波器的基本原理[30]1960年,Rudolph.E.Kalman提出了卡尔曼滤波器。卡尔曼滤波器经常被用于目标状态估计,可以通过建立运动目标的状态模型并对运动目标的运动速度和加速度进行估算,预测下一帧中目标的质心出现的位置,从而大大缩小了搜索范围,能够有效的克服运动目标被局[30]部遮挡而造成跟踪丢失的问题。运用卡尔曼滤波器对行人进行跟踪,可以不断的进行识别定位,及时更新相关参数,最终实现对行人运动物体的跟踪。行人的跟踪过程可看成一个动态的线性系统,卡尔曼滤波器算法主要是用来估算动态系统的状态序列的线性最小误差,它利用测量值去修正估计的状态,提供可靠的状态估计,这个动态系统可以通过状态方程和观测方程来描述,其数学模型为:状态方程:xAxBu(4.1)kk,k1k1kk1观测方程:zHxv(4.2)kkkk其中xk为状态向量,zk为观测向量;Ak,k1是tk1到tk时刻的状态转移矩阵,wk1是随机干扰向量;H是观测矩阵,v是噪声向量。由于B和u在本系统中没有选择,故取值为0;所kkk以状态方程可以简化为:xAx(4.3)kk,k1k1k1v,通常情况下假设两者为互不相关的且均值为0的高斯白噪声向量,满足kk1~~p(w)N(0,Q),p(v)N(0,R),令Q为状态噪声协方差矩阵,R为观测噪声协方差矩阵,既kk38 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪有:TQkikE[wkwi](4.4)0ikTRkikE[vkvi](4.5)0ikTE[wv]0对所有的K和I(4.6)ki在实际应用中,由于迭代计算,R和Q连个协方差矩阵可能会发生变化,为了降低计算kk复杂度,可假设两者都为常数。卡尔曼滤波一般过程如下:-首先可以根据k时刻的目标位置预测值从而获得先验估计值xk,则其协方差矩阵及其先验估计误差分别为:T--TPkE[ekek]E[(xkxk)(xkxk)](4.7)-ekxkxk(4.8)--预测值Hkxk和先验估计值xk以及实际观测值Zk三者之间进行加权线性组合,得到后验状态估计xk--xkxkKk(zkHkxk)(4.9)--实际观测值Zk与预测值Hkxk之间的误差为式中zkHkxk。修正滤波参数减少误差由增益矩阵K表示。k后验估计误差及其协方差矩阵分别为:ekxkxk(4.10)TTPkE[ekek]E[(xkxk)(xkxk)](4.11)将式(4.2)带入到式(4.10),将结果带入(4.11)式得:----TPkE{[(xkxk)Kk(HkvkvkHkxk)][(xkxk)Kk(HkxkvkHkxk)]}(4.12)进一步简化可得:TTP(IKH)P(IKH)KPK(4.13)kkkkkkkkk39 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪其中K:kTTT1PkHkKPH(HPHR)(4.14)kkkkkkkTTHPHRkkkk将式(4.14)带入到(4.13)得:P(IKH)P(4.15)kkkk由于在K时刻前误差k1与ek1没有任何相关性,则有下面简化形式:TTPE[ee]E[(Ae)(Ae)]kkkk,k1k1k1k,k1k1k1(4.16)TAPAQk,k1k1k,k1k1经过一系列的变换简化最终得到如下公式:预测方程:--xkAk,k1xk1(4.17)TPAPAQ(4.18)kk,k1k1k,k1k1修正方程:TT1KPH(HPHR)(4.19)kkkkkkk--xkxkKk(zkHxxk)(4.20)P(IKH)P(4.21)kkkk原理流程图如下:Kalman滤波器标识人体运动目目标标位位置置标标定定目标位置预测目标位置匹配参数初始化目标轨迹Kalman滤波器参数更新图4.1运动目标跟踪卡尔曼滤波器框图通过上述的分析,可以得出基于卡尔曼滤波的人体运动目标跟踪算法的一般计算步骤为:首先是初始化卡尔曼滤波器的各项参数,当根据运动目标检测与分类获得图像序列中人体运动目标的位置信息后,可初始化各项参数。进而使用卡尔曼滤波器的预测方程对人体运动目标的位置进行预测及完成对应位置的匹配,并且根据匹配的结果对卡尔曼滤波器的修正方程组进行参数修正和更新。最后,给出人体运动目标的运动轨迹,以实现对行人的定位与跟踪,40 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪4.2.2卡尔曼滤波器参数设定T设状态向量为:X[xydxdy](4.22)kk,k,k,kT观测向量为:Z[xy](4.23)kk,k假设人体运动目标近似为匀速直线运动,根据牛顿力学原理得:xkxk1dxk1ykyk1dyk1(4.24)dxdxkk1dydykk1根据上式得状态转移矩阵为:10t0010tA其中t为时间间隔00100001观测矩阵:1000H[]0100另外假设:1000010010QRkk0010010001当人体运动目标的初始状态向量X0[x0,y0,0,0]初始化后,便可进行连续的预测匹配,从而实现人体运动目标的跟踪定位。4.3基于Camshift算法的人体运动目标跟踪Camshift算法最早是由GaryR.Bradshi等人在1998年提出,它是改进的Meanshift算法,它能够解决当目标大小发生改变时Meanshift不能自适应的调整目标跟踪区域而造成目标丢失的问题。Camshfit算法是首先将图像转换为颜色概率分布图,进而通过目标本身的颜色特征信息,最后搜索的大小和位置进行初始化,搜索窗口的位置和大小是根据上一帧得到的结果进行自适应调整的,从而可以在当前图像中目标的中心位置进行定位。由于颜色特征对于41 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪目标的尺寸变化、姿态和遮挡等变化不敏感,计算简单,因此用Camshift算法进行人体运动目标的跟踪可以达到较理想的效果。4.3.1Meanshift算法[32]Meanshift这个概念最早是由Fukunage在1975年提出的,Meanshift算法属于核密度估计法,即它不需要任何先验知识,完全依据特征空间中样本点的计算其密度函数值。其基本原理是:为了使运算次数尽量减少可以利用梯度优化的方法,进而使得特征匹配的搜索时间缩短,目标和目标模板的相似性的测量是使用Bhattacharyya距离进行的,从而完成特征匹配,最终可以快速完成对目标的定位。要实现运动目标的跟踪,首先要初始化搜索框。初始化搜索窗设置为人体运动目标的最小外接矩,经过归一化后的目标大小为h,中心点为y,{xi}i1,2,...nk为候选区域的像素位置,则候选目标颜色概率密度函数为:nPu(y)Ch[b(xiu)](4.25)i1其中,Ch为归一化系数,b(xi)为像素点xi的色调。引入核估计后得:n21xxifh(x)dk(4.26)nhi1hn2yxiPuChk[b(xi)](4.27)i1hm由于p1,则有下式:u1u1C(4.28)k2nyxiki1h目标区域的离散概率密度函数为qqu,候选区域的离散密度函数为u1,2,...,mp(y)p(y)u,最后用Bhattacharyya系数来度量候选区域与目标的相似程度,完成目u1,2,...,m标的位置定位,定义候选模板和目标离散分布之间的距离为:d(y)1(y)(4.29)42 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪其中:m(y)(y),qp(y)qu(4.30)u1在被检测帧中为了找到运动目标,应该最小化候选目标分布p(y)与目标模板q分布的距离函数d(y),也即(y)应取得最大值。将(y)在p(y)处进行Taylor展开,得到线性近似:u01m1mqup(y),qpu(y0)qupu(y)(4.31)2u12u1p(y)u0通常来说,因为两帧的相隔时间较短,故可以认为初始目标模板和候选目标模板没有发生较大的改变,结合式(4.27)可得上式得变形公式:mnk2p(y),q1p(y)qChkyxi(4.32)2u0u2ihu1i1式中:mquib(xi)u(4.33)u1p(y)u0从上式中可以看出,等号右边第一项与y无关,所以只需要对第二项进行最大化处理,根据微积分原理,通过对第二项求梯度来寻找最大点,在此过程中,实现了当前帧中运动目标候选区域中心点的位置从y到新位置y的迭代。01nxgy0xii1iihy(4.34)1ngy0xii1ih'式中g(x)k(x),MeanShift向量为:nxgy0xii1iihm(y)yyy(4.35)0100ngy0xii1ih43 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪4.3.2Camshift算法上一节详细介绍了Meanshift算法的原理及其实现过程,本章开篇也提到过Camshift算[33]法是在Meanshift算法的基础上提出的。在图像序列中重复使用Meanshift算法,并根据人体运动目标的变化适时的调整搜索框的大小和位置,进而完成对行人的准确跟踪。算法详细步骤为:(1)对人体运动目标搜索窗的初始化。(2)选择比搜索窗稍大的区域,计算出目标H分量的直方图。(3)利用颜色直方图计算输入图像的反向投影图。(4)在反向投影图中通过使用MeanShift算法进行迭代搜索,直到达到最大迭代次数或者收敛,且对零次矩进行保存。(5)从上一步中获得搜索窗的中心位置和计算出新窗口的大小,并以此为参数进行下一帧的跟踪运算,即跳转到第(2)步。在计算目标大小时相关算法公式描述为:2MxI(x,y)(4.36)20cxy2MyI(x,y)(4.37)02cxyMxyI(x,y)(4.38)11cxy定义:M202ax(4.39)cM00M11b2xy(4.40)Mcc00M022cy(4.41)cM00则运动目标长轴方向角为:11btan(4.42)2ac运动目标的长宽分别为:44 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪22(ac)b(ac)l(4.43)222(ac)b(ac)w(4.44)2算法具体流程如下:初始化搜索框大小和位置输入HSV图像在在搜搜索索框框位位置置设设置置计算行人运动比比搜搜索索窗窗大大一一点点的的区域的H直方图计计算算区区域域颜色概率分布用当前帧目标的质心(x,y)和搜索窗初搜索窗内质心的位置始化下一帧搜索窗调整窗大小,将搜索窗中心移到质心位置是否返回质心位置收敛和搜索窗大小图4.2Camshift行人跟踪算法流程4.4基于Camshift算法和Kalman预测的人体运动目标跟踪在Camshift算法的跟踪的基础上即可以跟踪单个人体运动目标,同时也能够跟踪多个人体运动目标。如果存在目标的颜色与背景颜色相近、目标间相互干扰、目标运动速度快、目标被部分遮挡等干扰时容易出现目标丢失的情况发生。运用Kalman滤波器对人体运动目标进行跟踪,当目标发生部分遮挡或者跟踪丢失时,可以利用Kalman滤波器得到预测结果,在预测区域内定位搜索目标,使得搜索成功率得到显著提高,重新捕获目标后可以继续对目标进行跟踪,在一定程度上解决了目标遮挡问题。但是系统本身迭代运算会产生累计误差且系统方程并不是人体目标运动的物理过程完全真实的反映,再加上随机噪声的干扰,容易导致预测位置和实际位置之间会产生误差。Kalman滤波器的发散现象将会随着时间的推移偏差增高而发生,因此不断的获取准确的人体运动目标信息用于及时的更新修正相关参数,对于实现稳定可靠的Kalman滤波器跟踪来说至关重要。根据以上两种跟踪算法的优缺点,研究45 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪[34-35]提出结合Camshift算法和Kalman算法相结合的跟踪算法实现,充分利用运动信息和人体运动目标的色彩信息来实现准确的跟踪,具体流程如下:计算值目标状态初始化目标跟踪CCaammsshhiifftt算算法法KKaallmmaann滤滤波波器器更新和估计图4.3改进算法的流程具体实现步骤:(1)对滤波器参数进行初始化。运用改进的HOG特征在图像序列中检测到行人运动目标后,获取运动行人的状态消息,用目标行人的中心位置(x,y)及k=1初始化Kalman的状kk态向量。(2)对状态进行预测。根据第K帧图像参数用Kalman滤波器预测下一帧(K+1)图像人体运动目标的中心位置(xk1,yk1)。(3)搜索匹配。根据第K+1帧图像的运动目标状态信息运用Camshift算法计算出目标cc的质心位置xk1,yk1并最为人体运动目标的真实位置。(4)对结果进行修正处理。把第三步得到的目标真实位置输入到Kalman滤波器中,从而对滤波器方程的相关参数进行修正。(5)使得K=K+1,跳回第(2)步重新开始,循环顺序向下执行各步骤,就能够实现人体运动目标的准确跟踪。将Kalman滤波器与Camshift结合进行人体运动目标跟踪,虽然计算量有所增加,但是Kalman滤波可以对初始搜索点进行预测,从而对搜索范围进行了缩小,进而计算时间得到明显减少。判断人体目标的遮挡与否同样可以通过Bhattacharyya值。当Bhattacahryya值较大时,说明不存在遮挡,即预测目标与真实目标匹配程度较好,这里就可以只使用Camshift进行跟踪;如果Bhattacharyya值小于某一特定阈值时,此时则有噪声或遮挡等其他干扰因素,这时目标的位置可以通过使用Kalmanl滤波器来进行预测,并扩大适当的范围重复搜索直至目标再次出现,此时使用Camshift算法确定目标的真实位置,并对滤波方程的相关参数进行更新,从而可以使计算时间显著减少。需要说明的是Bhattacharyya的值要根据实际情况设定。该系统中实现的跟踪算法仅适用于背景与人体运动目标的颜色比较相近或目标被短暂的遮挡的情况,对于其他更复杂的情况有待进一步的研究。实验证明两者结合在跟踪速度上和46 南京邮电大学专业学位硕士研究生学位论文第四章Camshift与Kalman相结合的行人跟踪跟踪效果上比单一算法都有所提高。4.5本章小结本章主要研究结合Kalman滤波器和Camshift算法进行人体运动目标的跟踪。前者仅仅是跟踪目标的运动信息进行检测,后者则是跟踪目标的颜色特征进行检测。综合考虑将两者结合,利用Kalman算法为Camshift提供预测位置,并把通过Camshift算法得到的目标的真实位置作为观测值对滤波方程相关系数进行更新修正。最后通过实验得出两者的结合比单纯的使用其中一种算法具有更好的跟踪效果。47 南京邮电大学专业学位硕士研究生学位论文第五章实验结果与分析第五章实验结果与分析文中前几章主要是针对行人检测系统的各个功能模块以及对算法的改进与融合做了详细的介绍与分析,为了对系统研究中提出的算法的改进与融合在行人检测系统中应用的性能等各个方面给予评价,本章将设计实验进行验证,并根据实验数据具体分析算法的性能。5.1实验性能评价指标为了更直观的评价本行人检测系统的性能好坏,引入的一些评价性能的指标,主要包括识别率、误检率、漏检率以及丢失率指标。假设测试集中行人的个数为N,正确检测出的行人总数为T,发生误判的个数为F,行人没有正确的检测出来的个数为L,在行人跟踪的过程nnn中跟踪丢失的个数为Lost,针对这些假设则以上的性能指标的具体定义如下:(1)识别率:正确检测的行人个数与测试集中总的行人个数的比值。其值越大,表示此算法对行人的分类识别能力越强。计算公式如下:CF/N(5.1)rn(2)误检率:将其他物体错误的判别为行人的个数与检测到的行人个数的比值。其值越低,表示行人检测算法对非行人物体的排除能力越强。计算公式如下:FF/(TF)(5.2)rnnn(3)漏检率:没有被检测出的行人与数据集中行人总数的比值。其值越低,表示此算法的准确性越好。计算公式如下:LL/N(5.3)rn(4)鲁棒性:当运动行人的周围环境较为复杂或者存在其他噪声的影响,如光照、遮挡等情况的发生,都具有很强的适应能力,能够综合的反映出算法的以上性能。5.2实验步骤本章的实验包括以下几个步骤:(1)建立行人检测样本库,制作样本,包括训练样本和测试样本,采用的是INRIA数据库。(2)离线训练行人检测器。提取出训练样本的HOG特征,并基于PCA算法对原始HOG48 南京邮电大学专业学位硕士研究生学位论文第五章实验结果与分析特征进行特征降维,将降维后的HOG-PCA特征送入SVM分类器中进行分组交叉训练,最终得到高效的行人分类器。(3)选取测试视频序列,基于改进的Vibe算法进行运动物体的检测以及阴影的消除。(4)将检测的运动区域送入分类器进行检测,确定运动区域是否含有行人。(5)标记出行人区域,并运用改进的Camshift与卡尔曼滤波相结合的跟踪算法进行行人跟踪。具体的算法流程如下:正负行人视频序列样本图片运动目标检测形态学变换否是否为新目标HOG-PCASVM训练是特征提取分类器形态学变换否是否为HOG-PCA行人特征提取是Camshift结合Kalman跟踪目标输出结果图5.1行人检测算法流程5.3实验结果与分析本实验主要包含两方面的的内容:第一,验证行人检测分类器的分类效果,对静态图片中的行人进行检测;第二,测试视频序列,验证视频序列行人检测系统的准确性和实时性。本实验主要对行人识别,所以采集的图像中应尽可能多的包含不同角度、不同姿态的行人。实验过程中,为了减少图片尺寸不一致而造成的特征信息干扰,对所有样本均进行了归一化处理。实验一:根据文中第三章第三节介绍的样本制作过程的详细描述,并根据交叉验证的思想,基于INRIA行人检测数据库,训练出基于HOG-PCA特征的具有较高分辨能力的SVM行人检测分类器。为了对所得分类器的性能进行评价,包括识别率、漏检率、误检率和鲁棒性分析。本测试集采用了不同天气情况下及不同光照状态下各种姿态的行人图片。49 南京邮电大学专业学位硕士研究生学位论文第五章实验结果与分析图5.2显示了在不同光照条件、不同场景以及不同的天气情况下行人分类器的分类效果图。图5.2分类效果图从测试效果图中可以看出,基于改进的算法训练出的行人检测分类识别系统达到了预期的识别效果。白天光照较强,能够较为清晰的保留行人的轮廓,说明改进的行人检测算法对光照强度变化不敏感;当场景中只出现一个行人运动目标,分类识别算法能够较好的识别出该行人;对于包含多个行人的场景,在不存在相互遮挡的情况下,研究实现的行人检测算法也达到了较好的识别效果;对于多人场景且行人之间存在相互遮挡的情况时,该算法不能够检测出发生严重遮挡的行人,出现漏检的情况;若场景中出现与行人形状类似的物体时,该算法会把该物体误判为行人目标。系统的测试集采用目前应用最为广泛的INRIA行人数据库,从测试结果可知,在理想情况下,系统中行人检测的算法的识别率为94.3%,在阴天的情况下,识别率也达到90.6%以上,对于行人之间存在严重遮挡的情况下,识别效果欠佳,对于这种场景,本系统的行人检测算法还有待改进。实验二:本系统行人检测系统综合考虑了行人检测的识别率和实时性,在提高实时性方面加入了50 南京邮电大学专业学位硕士研究生学位论文第五章实验结果与分析跟踪模块,在运动目标刚进入场景时会被送入检测器判断是否是行人,若是行人便进入跟踪状态,此后的每帧不会再重复判断此运动目标是否为行人。根据评估测试确定的实验参数可以进行视频监控场景中的行人检测,本实验选取两个监控视频进行实验验证。选取的测试视频都是在背景固定的情况下即固定摄像头下对视频场中的行人进行分类识别,整个实验过程包括运动目标检测、行人检测和跟踪三个过程。为了清楚的展示实验效果,在实验的过程中,采用矩形框标示出检测出的行人目标,如图5.2为测试视频场景中原始图像,图5.3为采用第二章中该井的Vibe算法检测出的运动目标,并进行了阴影消除,图5.4为最终的识别效果。(a)原图(b)前景图(c)识别跟踪结果图5.3Test1测试结果(a)原图(b)前景图(c)识别跟踪结果图5.4Test2测试结果根据表中的实验结果发现,针对测试视频test1的行人检测的识别率较低,主要是因为test1中拍摄的角度问题,不能明显的显示出行人的结构轮廓;另一方面test1中存在明显的光照等因素的影响,行人存在很长的阴影,虽然进行了阴影消除,但也会存在少许阴影的干扰,这会对行人检测产生干扰。从test2的实验结果可以看出,在没有阴影的干扰,背景也相对简单51 南京邮电大学专业学位硕士研究生学位论文第五章实验结果与分析的情况下,行人识别率明显提高。5.4本章小结本章主要对基于HOG特征的行人检测与跟踪的实现进行了实验的验证。首先对基于改进的HOG特征描述子的分类识别效果进行了验证,通过NRIA行人数据库中的图片进行行人检测可以看出,本文提出的改进算法是可行的、有效的。另外,选取了几路监控视频进行了实验验证,并展示了两路典型情况下本行人识别系统对行人的分类识别与跟踪实验结果。同时,本章对实验数据进行了分析,阐明了算法的优劣。52 南京邮电大学专业学位硕士研究生学位论文第六章总结与展望第六章总结与展望6.1总结本研究主要是针对背景固定的视频监控中行人检测与跟踪,主要包括运动目标的检测、阴影检测与消除、行人检测与识别和行人目标的跟踪等几个方面,其中,运动目标的检测与跟踪是目标分类的基础。文中在总结国内外基于视频序列的行人检测研究成果的基础上,针对行人检测与分类识别涉及到的视频分析处理技术,分别从运动目标检测、运动目标分类识别算法和运动目标跟踪算法方面进行了重点研究。(1)在运动目标检测阶段,文中首先简要介绍了常用的运用目标检测的基本原理,接着重点介绍系统进行运动目标检测的Vibe算法,Vibes算法是基于背景差分思想实现的,该算法是像素级的背景建模方法,将视频的第一帧作为背景,能够实现快速检测运动目标。针对Vibe在初始检测中可能出现的鬼影现象,研究将Vibe算法与OSTU算法相融合,实现了快速消除鬼影的目的。(2)在行人分类检测阶段,系统采用HOG特征作为行人检测的初始提取特征,它可以描述物体的局部形状特征并在一定程度上抑制了光照变化对行人识别造成的影响,也是近年来行人检测研究领域常用的特征提取算法,具有较高的识别率和较好的鲁棒性,针对HOG特征维度较高检测速度较慢的缺点,文中运用PCA算法进行降维,最终形成HOG-PCA特征矩阵,经过试验验证,此融合算法具有较高识别率和较快检测速度的特点。(3)在行人目标跟踪阶段,针对人体运动目标的跟踪,文中首先介绍了卡尔曼滤波器和基于目标颜色特征的Camshift算法在运动目标跟踪中的应用。针对在遇到背景颜色与目标颜色大面积相近时的干扰和由于行人运动目标存在短暂的相互遮挡等问题而导致目标跟踪丢失的问题,研究提出了改进的行人跟踪算法——Camshift与Kalman滤波算法相融合,有效的解决了上述问题。(4)最后将各个模块进行了融合形成了行人检测与跟踪系统,并对视频监控序列进行了验证,通过对实验结果的分析表明,本研究实现的行人检测与跟踪算法在识别率和实时性上都有较好的表现。53 南京邮电大学专业学位硕士研究生学位论文第六章总结与展望6.2研究展望本研究主要是基于背景固定的视频监控中行人检测与跟踪的系统实现,该研究领域融合了多门学科,具有很高的理论价值和广阔的应用前景。在经过大量的分析研究之后,实现了行人的检测与跟踪系统,但是由于时间有限,水平有限,还存在很多不足之处需要日后进一步的深入研究:(1)在研究行人的分类识别时主要考虑到行人的静态特征,在视频监控场中,不同类别的运动目标,其静态特征存在一定的区分度,但有时动态往往区分度较为明显,如行人和机动车辆在运行速度上存在较大的差异,可作为初次分类判别的标准。在特征提取中充分考虑运动目标的静态特征和动态特征能够更精准的区分出行人欲其他运动目标。本系统的分类识别算法未考虑行人目标的动态特征,下一步可考虑静态与动态特征进行融合提取。(2)针对HOG特征分类识别的时间较长,提出运用PCA算法进行降维达到提高识别速度的目的,但是特征降维本身也需要一定的时间,所以识别速度的提高是有限的,距离实际的实时性应用还有一定的差距,实时性上还有待进一步的研究。(3)对基于目标颜色特征的Camshift目标跟踪算法进行了改进算法,解决了背景颜色与目标颜色相近和多目标相互遮挡带来的干扰,但是当目标遮挡较为复杂,存在大量目标相互混合时,跟踪效果很差,有待进一步完善。(4)虽然实现了视频监控中行人的检测与跟踪,但也只是一个背景固定的行人检测与多目标跟踪系统,在实际的应用当中往往是背景在不断变化、摄像头会随着运动物体的运动而转动。因此,针对动态背景和摄像机转动情况下的行人运动目标检测的算法有待进一步研究。54 南京邮电大学专业学位硕士研究生学位论文参考文献参考文献[1]DucThanhNguyen,WangqingLi,PhiliO.Ogunbona.Humandetectionfromimagesandvideos:Asurvey[J].PatternRecognition,2016,51:148-175.[2]M.Enzweiler,D.M.Gavrila.Monocularpedestriandetection:surveyandexperiments[J].IEEETransPatternAnal.Mach.Intell.2009,31(12):2179-2195.[3]ZhongWang,XianbinCao,Ping-kunYang.TransferLearningforPedestrianDetection[J].Neurocomputing,2013,100(1):51-57.[4]车志富.基于支持向量机的行人检测[D].北京交通大学,2010.4[5]IsmailHaritaoglu,DavidHarwood,LarryS.Davis.W:Real-timesurveillanceofpeopleandtheiractivities[J].IEEETransactionsOnPatternAnalysisAndMachineIntelligence,2000,22(8):809-830.[6]ChenPeijun,WangGuoyin,YangYong,etal.FacialexpressionrecognitionbasedonroughsetthepryandSVM[J].LectureNotesinComputerScience,2006,40(62):772-777.[7]XianbinCao,QiaoHong,WangFeiyue,etal.Applicationofcooperativeco-evolutioninpedestriandetectionsystems[C].IntelligenceandSecurityInformatics,2005:664-665.[8]WangFeiyue,CaoXianbin.Thetreelikeassemblyclassifierforpedestriandetection[A].IntelligenceandSecuritInformatics,Chengdu,2007:232-237.[9]李庆忠,陈显华,王立红.视频监控中运动目标检测与识别方法[J].计算机工程,2004,30(16):143-145.[10]AlanJ.Liption,HironobuFujiyoshi,RajuS.Patil.Movingtargetclassificationandtrackingfromreal-timevideo[C].ProceedingIEEEWorkshoponApplicationsofComputerVision,1998:8-14.[11]何卫平,李华,文玉梅等.复杂背景下基于图像融合的运动目标轮廓提取算法[J].计算机应用,2006,2(1):123-126.[12]GrzegorzM,Wojcik,WieslawA.Kaminski.LiqiuidstatemachinebuiltofHodgkin-Huxleyneuronsandpatternrecgnition[J].Neurocomputiing,2004,58(6):245-251.[13]MingyingZhao,JunZhao,ShuguangZhao,etal.ANovelMethodforMovingObjectDetectioninIntelligentVideoSurveillanceSystems[C].InternationalConferenceonComnutationalIntelligenceandSecurity,2006,2:1797-1800.[14]YamamotoS,MaeY,ShiraiY.Realtimemultipleobjecttrackingbasedonopticalflows[C].IEEEInternationalConferenceonRoboticsandAutomation.1995,3:2328-2333.[15]BarronJ,FleetD,BeaucheminS.Performanceofopticalflowtechnique[J].InInternationalJournalofComputerVision,1994,12(1):42-77.[16]JongBaeKim,HyeSunPark,MinHoPark,etal.Areal-timeregion-basedmotionsegmentationusingadaptivethresholdingandk-meansclustering[J].AdvancesinArtificialIntelligence,2001,2256:213-224.[17]卢官明,徐方明,沈苏彬.一种自适应背景建模及运动检测方法[P].中国,200910183859.X,2009-7-24.[18]常晓峰,冯晓毅.基于背景减法和时空熵的运动目标检测新方法[J].计算机仿真,2008,25(3):235-238.[19]HanB,ComaniciuD,DavisL.Sequentialkerneldensityapproximationthroughmodepropagation:applicationstobackgroundmodeling[C].InProc.ACCV-AsianConf.OnComputerVision,2004.[20]BarnichO,VanDroogenbroeckM.ViBe:apowerfulrandomtechniquetoestimatethebackgroundinvideosequences[C].IEEEInternationalConferenceonICASSP.2009:945-948.[21]KryjakT,GorgonM.Real-timeimplementationoftheViBeforegroundobjectsegmentationalgorithm[C].ComputerScienceandInformationSystems(FedCSIS),2013:591-596.[22]LiY,ChenW,JiangR.TheintegrationadjacentframedifferenceofimprovedViBeforforegroundobjectdetection[C].WirelessCommunications,IEEEConferenceonWiCOM,2011:1-4.[23]OtsuN.Athresholdselectionmethodfromgray-levelhistograms[J].Automatica,1975,11(285-296):55 南京邮电大学专业学位硕士研究生学位论文参考文献23-27.[24]王晓东,霍宏,方涛.基于快速归一化互相关函数的运动车辆阴影检测算法[J].计算机应用学报,2006,26(9):2065-2067.[25]DalalN,TriggsB.Histogramsoforientedgradientsforhumandetection[J].IEEEConferenceonComputerVision&PatternRecognition.2005:556-893.[26]PaulA.Viola,MichaelJ.Jones.Rapidobjectdetectionusingaboostedcaacadeofsimplfeatures[J].IEEEConferenceonComputerVisionandPatternRecognition,2001:511-518.[27]LoweDG.Localfeatureviewclusteringfor3Dobjectrecognition[J].ProceedingsoftheConferenceonComputerVisionandPatternRecognition,2001:682-688.[28]ZhuQing,AvidanShai,Mei-ChenYeh,etal.FastHumanDetectionUsingaCascadeofHistogramsofOrientedGradients.ProceedingsoftheIEEEComputerSocietyConferenceonComputerVisionandPatternRecognition.2006,2:1491-1498.[29]朱梦超,潘今一.基于HOG-PCA和SVM的人行横道信号灯识别方法[J].工业控制计算机.2015,28(4):125-126.[30]ViolaP.,JonesMJ.Robustreal-timeobjectdetection[J].InternationJournalofComputerVision,2004,57(2):134-154.[31]BoWu,NevatiaR.Detectionofmultiple,partiallyoccludedhumansinsingleimagebyBayesiancombinationofedgeletpartdetectorss[C].IEEEInternationalConferenceonComputerVision,2005,1:90-97.[32]OjalaT,PietikinenM,HarwoodD.Acomparativestudyoftexturemeasureswithcalssifcationbasedonfeaturedistributions[J].PatternRecognition,1998,29(1):51-59.[33]MajiS,BergA,MalikJ.Classificationusingintersectionkernelsupportvectormachinesissfficient.IEEEConferenceonComputerVisionandPatternRecognition,2008:1-8.[34]JinPY.ThestudyofimprovingalgorithmsofBPnetwork[J].JournalofNanjingofAeronauticsandAstronautics.1994,11:201-205.[35]KantarcogluM,VaidyaJ.PrivacypreservingNaiveBayesclassifierforhorizontallypartitioneddata[A].ProceedingsoftheIEEEICDMWorkshoponPrivacyPreservingDataMining.2003:3-9.[36]VapnikV.TheNatureofStatisticalLearingTheory[M].Berlin:SpringerVerlag,1999.[37]LuWei-Lwun,Little,JamesJ.Simultaneoustrackingandactionrecognitionusingthepca-hogdescriptor[C].ComputerandRobotVision,2006,9(3):6.[38]KarlssonR,SchonTB,GustafssonF.Complexityanalysisofthemarginalizedpartielefilter[J],IEEETransactionsonSignalProeessing,2005,53(11):44084411.[39]张江山,朱光喜.一种基于Kalman滤波的视频对象跟踪方法[J].中国图像图形学报,2002,7(6):606-608.[40]S.Maji,A.[41]FukunagaK.,Hostetler.TheEstimationoftheGradientofaDensityFunction,withapplicationsinPatternRecognition[J].IEEETransactionsonInformationTheory,1975,1(21):32-40.[42]BradskiG.R,S.Clara.ComputerVisionFaceTrackingForUseinaPerceptualUserInterface[J].InterTechnologyJournal,1998:21-15.[43]彭娟春,顾立忠,苏剑波.仿人机器人手势跟踪[J].上海交通大学学报,2006.7(7):1161-1165.[44]候杰虎.基于Kalman滤波器的视频运动目标跟踪算法研究[D].成都:成都理工大学,2012:4-5.[45]陈亮,陈晓竹,范振涛.基于Vibe的鬼影抑制算法[J].中国计量学院学报,2013,(4):425-429.[46]TonsMatthias,DoerflerReiner,MeineckeMarc-Michael.RadarsensorsandsensorplatformusedforpedestrianprotectionintheEC-fundedprojectSAVE-U[J].ProceedingsofIEEEIntelligentVehiclesSymposium,200:813-818.[47]FelzenszwalbP,McAllesterD,RamananD.Adiscriminativelytrained,multiscale,deformablepart56 南京邮电大学专业学位硕士研究生学位论文参考文献model[C].IEEEConferenceonComputerVisionandPatternRecognition,2006:17-22.[48]HuangC,NevatiaR.HighperformanceobjectdetectionbycollaborativelearningofJointRankingofGranulesfeatures.IEEEConferenceonComputerVisionandPatternRecognition,2010:41-48.[49]LiW,YangO,WangX.G.Adiscriminativedeepmodelforpedestriandetectionwithocclusionhandling.IEEEConferenceonComputerVisionandPatternRecognition,2012,3258-3265.[50]SzegedyC,ToshevA,ErhanD.Deepneuralnetworksforobjectdetection[J].ProceedingsoftheConferenceonAdvancesinNeuralInformationProcessingSystems,2013:2553-2561.[51]ErhanD,SzegedyG,ToshevA,AnguelovD.Scalableobjectdetectionusingdeepneuralnetworks[C].IEEEInternationalConferenceonComputerVisionandPatternRecognition,2014:2155-2162.[52]GirshickR,DonahueJ,DarrellT,etal.Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation[C].IEEEInternationalConferenceonComputerVisionandPatternRecognition,2014:580-587.[53]LiuMY,TuzelO,VeeraraghavanA,etal.Fastdirectionalchamfermatching[C],IEEEInternationalConferenceonComputerVisionandPatternRecognition,2010:1696-1703.[54]GkioxariG,HariharanB,GirshickR,rtal.Usingk-poseletsfordetectingpeopleandlocalizingtheirkeypoints,IEEEInternationalConferenceonComputerVisionandPatternRecognition,2014:3582–3589.[55]ViolaP,JonesM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[J].IEEEConferenceonComputerVisionandPatternRecognition,2001,1:511-518.[56]LiSZ,ZhangZQ.FloatBoostlearningandstatisticalfacedetection[C].IEEETransactionsonPatternAnalysisandMachineIntelligenec,2004,26(9):1-12.[57]HuangC,AiH,LiY,etal.High-performancerotationinvariantmulti-viewfacedetection[C].IEEETransactionsonPatternAnalysisandMachineIntelligence,2007,29(4):671-686.[58]MuY,YanS,LiuY,etal.Discriminativelocalbinarypatternsforhumandetectioninpersonalalbum[C].IEEEConferenceonComputerVisionandPatternRecognition,2008:1-8.[59]DalalN,TriggsB,SchmidC.Humandetectionusingorientedhistogramsofflowandappearance.ProceedingsofEuropeanConferenceonComputerVision,2006,2:428-441.[60]WalkS,MajerN,SchindlerK,etal.Newfeaturesandinsightsforpedestriandetection[J],IEEEConferenceonComputerVisionandPatternRecognition,2010:1030-1037.57 南京邮电大学专业学位硕士研究生学位论文致谢致谢转眼之间,两年半研究生生活即将结束,有太多的不舍与眷恋,在这短短的两年半的岁月里,汲取知识的同时,收获更多的是感动,值此论文撰写完成之际,对在研究生期间无论是生活上还是学习上支持我、帮助过我的老师、同学、朋友以及家人表示最真诚的感谢!首先,要衷心的感谢我的导师卢官明教授,卢老师治学严谨、平易近人、师德高尚,备受学生的景仰与爱戴,也因此被评选为全国优秀教师。在与卢老师两年半的相处中,学到治学之道、做人之本,受用终生。在论文撰写过程中也得到了卢老师和闫静杰老师的悉心指导,纠正错误,指明方向,也使得自己对专业知识有了更深入的了解。再次感谢卢老师!其次,我要感谢研究期间结识的同学朋友,感谢张庆年、刘大成、张海欣、周期才、姜斌、陈浩、吴晴、余益团、石婉婉、刘陶鸿等人,感谢你们在我论文撰写期间给予的意见与建议。感谢和你们一起度过难忘的研究生生活,没有你们研究生生活会少几分快乐,你们对待学习认真的精神、对待生活乐观的态度、对待朋友倾心之交的品质感染了我,让我获益匪浅。再次,我要感谢我的家人,感谢在我求学路上的默默支持与陪伴,让我在学校衣食无忧安心学习,今日取得的小小成就与您们的付出分不开,无论走到哪里,亲情永不变。最后,感谢在百忙之中抽出时间参加论文评审与答辩审议的各位专家教授。58
此文档下载收益归作者所有