基于神经网络的动作识别方法的研究

基于神经网络的动作识别方法的研究

ID:37022815

大小:1.64 MB

页数:61页

时间:2019-05-17

基于神经网络的动作识别方法的研究_第1页
基于神经网络的动作识别方法的研究_第2页
基于神经网络的动作识别方法的研究_第3页
基于神经网络的动作识别方法的研究_第4页
基于神经网络的动作识别方法的研究_第5页
资源描述:

《基于神经网络的动作识别方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于神经网络的动作识别方法的研究ResearchonHumanActionRecognitionBasedonNeuralNetwork学科专业:信息与通信工程作者姓名:安阳指导教师:苏育挺教授天津大学电气自动化与信息工程学院2017年11月摘要近年来,视频数据量呈爆炸性增长,应用领域更趋多样性,涉及到安全、监控和娱乐等各个领域。面对如此海量的数据,传统的人工处理已经无法满足人们的需求。因此,利用计算机强大的存储和计算能力实现对视频信息的识别和理解,具有重要的研究价值和广阔的应用前景。针对人体动作识别问题,本文

2、首先围绕特征提取和动作分类两个关键步骤展开论述,重点介绍了广泛使用的时空兴趣点的检测和表征方法,以及常用的动作分类算法。然后,分别从特征提取和动作分类两个角度就本文提出的基于神经网络的人体动作识别方法展开详细论述:(1)传统的卷积神经网络是在二维图像上执行卷积和池化操作来进行特征提取,无法保留视频序列的时间信息,而3D卷积神经网络是在三维时空立方体上执行3D卷积和3D池化操作,可以有效地提取到视频序列的时空信息。以此为基础,本文提出了基于3D卷积神经网络的人体动作识别算法框架。(2)对于不同的视频,卷积神经网络

3、提取到的特征数量不同,在进行动作分类时,采用监督学习的方法还需要利用这些特征对视频特征进行统一表征,而这可能会稀释动作的关键特征。因此,本文引入了多示例学习的方法去训练分类模型,以使分类器具有识别相似动作之间微小区别的能力。最后,我们训练了3D卷积神经网络,并在相应数据库上进行了实验验证和结果分析。关键词:人体动作识别,卷积神经网络,多示例学习ІABSTRACTInrecentyears,theamountofvideodatahasincreasedexplosively,andithasbeenusedin

4、manyfields,involvingsecurity,monitoring,entertainmentandsoon.Facedwithaseeminglyendlessstreamofvideodata,thetraditionalmanualdataprocessingmethodcannotmeetthedemandofresearchers.Therefore,itisofgreatvalueinboththeoreticalresearchandactualpracticetorealizethe

5、recognitionandcomprehensionofvideoinformationwiththehelpofthepowerfulstorageandcomputationabilityofcomputers.Thispaperfirstlydescribeshumanactionrecognitionalgorithmsfromtwoaspects:featureextractionandactionclassification,especiallyfocusingonthedetectionandd

6、escriptionofspatio-temporalinterestpointaswellasactionclassificationmethods.Thenthispaperintroducesthemethodofhumanactionrecognitionbasedonneuralnetworksfromthesetwoaspectsrespectively.(1)Traditionalconvolutionalneuralnetwork(CNN)performsconvolutionandpoolin

7、goperationsontwo-dimensionalimagestoextractfeaturevectors,whichcannotpreservethetemporalinformationofinputvideosequences.Inordertomakeuseofthetemporalinformation,3DCNNperforms3Dconvolutionand3Dpoolingoperationsonthree-dimensionalspatio-temporalcubes,obtainin

8、gspatio-temporalinformationefficientlyandeffectively.Basedonthat,thispaperproposedanalgorithmframeworkofhumanactionrecognitionbasedon3DCNN.(2)Fordifferentvideos,thenumberoffeaturevectorsextracte

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。