资源描述:
《人体动作识别技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第36卷计算机学报Vol.362013年论文在线发布号No.7CHINESEJOURNALOFCOMPUTERS2013ArticleOnlineNo.7?基于视觉的人体动作识别综述1)1)1),2)胡琼,秦磊,黄庆明1)(中国科学院智能信息处理重点实验室,中国科学院计算技术研究所,北京100190)2)《计算机学报》提前在线出版(中国科学院大学,北京100190)摘要基于视觉的人体动作识别是图像处理、计算机视觉、模式识别、机器学习、人工智能等多个学科的交叉研究课题,在视频监控、视频检索、人机交互、虚拟现实、医疗看护等领域具有深远的理
2、论研究意义和很强的实用价值。本文从特征提取的方法、动作识别的方法、相关国际竞赛与常用数据库、研究难点与可能的发展方向等方面详细阐述该领域目前的研究现状。关键词计算机视觉、模式识别、视觉特征提取、人体动作识别中图法分类号TP391DOI号:ASurveyonVisualHumanActionRecognition1)1)1,2)HUQiong,QINLei,HUANGQing-Ming1)(KeyLaboratoryofIntelligentInformationProcessing,InstituteofComputingTechno
3、logy,ChineseAcademyofSciences,Beijing100190)2)(UniversityofChineseAcademyofSciences,Beijing100190)AbstractVisualHumanActionRecognitionisauniversalhottopicofimageprocessing,computervision,patternrecognition,machinelearningandartificialintelligencewithwideapplicationsinvi
4、deosurveillance,videoretrieval,human-computerinteraction,virtualreality,healthcare,etc.Inthispaper,weanalyzethestate-of-the-artsandadvancesofthisfieldfromperspectivesoffeatureextraction,actionrecognitionmethodsaswellasbenchmarkdatasetsandcompetitions.Inaddition,theprobl
5、ems,difficulties,challengesandvaluablefuturedirectionsofhumanactionrecognitionarepresented.KeywordsComputerVision;PatternRecognition;VisualFeatureExtraction;HumanActionRecognition生。面对海量涌现的视频数据,如何去自动获取、1引言分析其中包含的内容就成为一个亟待解决的问题。大多数视频记录的都是作为社会活动主体的人随着视频获取设备和宽带网络的快速普及和发的活动,
6、不论是从安全、监控、娱乐,还是个人存展,视频已成为信息的主要载体,且视频数据的数档的角度,对视频中人体动作识别进行研究具有重[1]量呈爆炸式增长,每时每刻都会有大量新的内容产要的学术和应用价值。基于视觉的人体动作识别———————————————收稿日期:2011年9月30日;最终修改稿收到日期:2013年6月27日.本课题得到国家重点基础研究发展计划(973计划)项目课题(2009CB320906)、国家自然科学基金(61025011,61133003,61035001,61003165)、北京市自然科学基金(4111003)资助.
7、胡琼,女,1986年生,博士生(Rutgers,TheStateUniversityofNewJersey),主要研究领域为计算机视觉与模式识别,qionghu2006@gmail.com.秦磊(通讯作者),男,1977年生,博士,副研究员,计算机学会(CCF)会员(E200021256M),主要研究领域为计算机视觉与模式识别,qinlei@ict.ac.cn.黄庆明,男,1965年生,博士,教授,博士生导师,国家杰出青年科学基金获得者,主要研究领域为多媒体分析、图像处理、计算机视觉、模式识别等,qmhuang@jdl.ac.cn.手
8、机号码:13810746437,E-mail:qinlei@ict.ac.cn2计算机学报2013年要解决的主要问题是通过计算机对传感器(摄像机)2动作识别特征采集的原始图像或图像序列数据进行处理和分析,[2]学习并理解