资源描述:
《复杂背景下的手势分割与识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第28卷第2期自动化学报Vol128,No122002年3月ACTAAUTOMATICASINICAMar.,2002短文1)复杂背景下的手势分割与识别任海兵祝远新徐光张晓平林学(清华大学计算机科学与技术系媒体所北京100084)(E2mail:Renhb@media.cs.tsinghua.edu.cn)摘要目前在基于单目视觉的手势识别中,手势分割技术几乎都是基于简单的背景或者要求手势者带有特殊颜色的手套,给人机交互增加了一定的限制.本文融合人手颜色信息和手势运动信息,两次利用种子算法对复杂背景下的手势进行
2、分割.根据分割出的手区域大大加速了运动特征参数的提取,并结合手区域的形状特征,建立手势的时空表观模型.识别时,采用独立分布的多状态高斯概率模型,进行时间规整.手势训练集和测试集的识别率分别为97.8%和95.6%.关键词复杂背景,手势分割,手势识别,独立分布,多状态高斯概率模型中图分类号TP291HANDGESTURESEGMENTATIONANDRECOGNITIONWITHCOMPLEXBACKGROUNDSRENHai2BingZHUYuan2XinXUGuang2YouZHANGXiao2PingLI
3、NXue2Yin(MediaInstitute,DepartmentofComputerScienceandTechnology,TsinghuaUniversity,Beijing100084)(E2mail:Renhb@media.cs.tsinghua.edu.cn)AbstractCurrently,inthevision2basedhandgesturerecognition,almostallthetechnologiesonhandgesturesegmentationarebasedonsim
4、plebackgroundsoronglovesinspecialcolors,whichgivethehuman2computerinteractionsomelimitation.Thispaperpresentsanewmethod,whichsegmentshandgestureswithcomplexbackgroundsbyfusingskinchrominanceandcoarseimagemotion,andbyusingtheseedalgorithmtwice.Withthesegment
5、edhandareas,thealgorithmformotionappearanceparametersisacceleratedgreatly.Byintegratingtemporalinformation,motionandshapeappearances,aspatio2temporalappearancemodelisproposedforrepresentingdynamichandgestures.Thispaperalsopresentsanindependentdistributedmul
6、ti2stateGaussianprobabilitymodel(IDMGPM)forrecognition.Inthissystemtheaveragerecognitionrateis9718%onthetrainingsetand9516%onthetestingset.KeywordsComplexbackground,handgesturesegmentation,handgesturerecognition,independentdistributed,multi2stateGaussianpro
7、babilitymodel1)国家自然科学基金(69873022)和国家“八六三”(86323062ZT0320121)资助收稿日期1999210220收修改稿日期20002092152期任海兵等:复杂背景下的手势分割与识别2571引言在多模态的人机交互方面,除了大家所熟知的语音识别外,还有人脸识别,面部表情解[1]释,唇读,头部运动跟踪,注视跟踪,三维手指定位,手势识别和体势识别等方面.手势识别是其中一个崭新的领域.基于计算机视觉的手势识别方法使用摄像机直接拍摄手势运动过程,从手势图像序列中分割出人手,根据
8、图像序列前后帧之间的关系计算出运动参数.如美国MIT媒体实验室[2]的Starner,通过提取左右手质心的运动轨迹、手的形状等特征参数,结合语法规则识别40个美国手语,正确率达到97%(没有语法规则的正确率为90.7%).另外,MicrosoftKorea[3]的Hyeon2KyuLee,利用基于HMM的阈值模型(HMM2BasedThresholdModel)从单手的运动轨迹识别出9种手势命令,平