欢迎来到天天文库
浏览记录
ID:37022815
大小:1.64 MB
页数:61页
时间:2019-05-17
《基于神经网络的动作识别方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于神经网络的动作识别方法的研究ResearchonHumanActionRecognitionBasedonNeuralNetwork学科专业:信息与通信工程作者姓名:安阳指导教师:苏育挺教授天津大学电气自动化与信息工程学院2017年11月摘要近年来,视频数据量呈爆炸性增长,应用领域更趋多样性,涉及到安全、监控和娱乐等各个领域。面对如此海量的数据,传统的人工处理已经无法满足人们的需求。因此,利用计算机强大的存储和计算能力实现对视频信息的识别和理解,具有重要的研究价值和广阔的应用前景。针对人体动作识别问题,本文
2、首先围绕特征提取和动作分类两个关键步骤展开论述,重点介绍了广泛使用的时空兴趣点的检测和表征方法,以及常用的动作分类算法。然后,分别从特征提取和动作分类两个角度就本文提出的基于神经网络的人体动作识别方法展开详细论述:(1)传统的卷积神经网络是在二维图像上执行卷积和池化操作来进行特征提取,无法保留视频序列的时间信息,而3D卷积神经网络是在三维时空立方体上执行3D卷积和3D池化操作,可以有效地提取到视频序列的时空信息。以此为基础,本文提出了基于3D卷积神经网络的人体动作识别算法框架。(2)对于不同的视频,卷积神经网络
3、提取到的特征数量不同,在进行动作分类时,采用监督学习的方法还需要利用这些特征对视频特征进行统一表征,而这可能会稀释动作的关键特征。因此,本文引入了多示例学习的方法去训练分类模型,以使分类器具有识别相似动作之间微小区别的能力。最后,我们训练了3D卷积神经网络,并在相应数据库上进行了实验验证和结果分析。关键词:人体动作识别,卷积神经网络,多示例学习ІABSTRACTInrecentyears,theamountofvideodatahasincreasedexplosively,andithasbeenusedin
4、manyfields,involvingsecurity,monitoring,entertainmentandsoon.Facedwithaseeminglyendlessstreamofvideodata,thetraditionalmanualdataprocessingmethodcannotmeetthedemandofresearchers.Therefore,itisofgreatvalueinboththeoreticalresearchandactualpracticetorealizethe
5、recognitionandcomprehensionofvideoinformationwiththehelpofthepowerfulstorageandcomputationabilityofcomputers.Thispaperfirstlydescribeshumanactionrecognitionalgorithmsfromtwoaspects:featureextractionandactionclassification,especiallyfocusingonthedetectionandd
6、escriptionofspatio-temporalinterestpointaswellasactionclassificationmethods.Thenthispaperintroducesthemethodofhumanactionrecognitionbasedonneuralnetworksfromthesetwoaspectsrespectively.(1)Traditionalconvolutionalneuralnetwork(CNN)performsconvolutionandpoolin
7、goperationsontwo-dimensionalimagestoextractfeaturevectors,whichcannotpreservethetemporalinformationofinputvideosequences.Inordertomakeuseofthetemporalinformation,3DCNNperforms3Dconvolutionand3Dpoolingoperationsonthree-dimensionalspatio-temporalcubes,obtainin
8、gspatio-temporalinformationefficientlyandeffectively.Basedonthat,thispaperproposedanalgorithmframeworkofhumanactionrecognitionbasedon3DCNN.(2)Fordifferentvideos,thenumberoffeaturevectorsextracte
此文档下载收益归作者所有