基于bp神经网络手势识别系统

基于bp神经网络手势识别系统

ID:5994232

大小:31.00 KB

页数:8页

时间:2017-12-30

基于bp神经网络手势识别系统_第1页
基于bp神经网络手势识别系统_第2页
基于bp神经网络手势识别系统_第3页
基于bp神经网络手势识别系统_第4页
基于bp神经网络手势识别系统_第5页
资源描述:

《基于bp神经网络手势识别系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于BP神经网络手势识别系统  摘要:给出了采用ADXL335加速度传感器来采集五个手指和手背的加速度三轴信息,并通过ZigBee无线网络传输来提取手势特征量,同时利用BP神经网络算法进行误差分析来实现手势识别的设计方法。最后,通过Matlab验证,结果表明,该系统在测试中识别率较高,系统稳定。关键字:Zigbee;BP神经网络;手势识别;加速度传感器中图分类号:TP391文献标识码:A文章编号:2095-1302(2013)07-0013-030引言8随着科技的发展和进步,计算机已经渐渐适应人的需求。人类在利用计算机解决问题时,并没有将主观能动性和计算机

2、的高效性有机地结合起来。研究新型的人机交互工具能够打破这一障碍。当虚拟现实越来越被人熟知时,可以使用手势作为载体进行人机交互。目前,手势输入的种类有基于图像的和基于加速度传感器的。由于图像的手势识别对外部环境的依赖比较大,而加速度传感器识别就不受外部条件的限制,甚至可以依靠单手完成操作[1],因此,基于加速度传感器的方法能有效地识别手势动作,完成人机交互。本文采用ADXL335三轴加速度传感器分别采集五个手指和手背上的加速度信息,实现手势的输入。1手势识别方法手势的执行是一个动态的过程,主要表现在手指弯曲引起的手的形状和手在空间的位置和方位的变化,需要从时

3、间和空间两方面来描述。根据手势的时变特征,可将手势分为静态手势和动态手势[2]。从测量的角度看,静态手势可用某一时刻手的空间特征的测量值来表示,而动态手势是指需要使用随时间变化的空间特征来描述的手势。静态手势可以用各个关节测得的特征值来表示,而动态手势需用一段时间内手的空间特征的一组测量序列值来表示[3]。人的手有多个自由度,运动十分灵活、复杂,而且不同的人,手的大小不同。因此,同样的手势,不同的人作出时手的运动会存在差别;同一个人在不同的时间、地点作出手势也不一样[4]。所以,本文主要针对静态手势的数据手套进行分析研究。2手势的识别技术目前,比较流行的手

4、势识别技术有模板匹配法、特征提取和BP算法等。模板匹配法:主要是将传感器输入的原始数据与预先存储的模板进行匹配,通过测量两者之间的相似度来完成识别任务[5]。由于需要大量的基础数据作为匹配对象,所以受到噪声、光照、复杂环境影响较大,并且匹配速度慢。但是,模板匹配法简单、易掌握,普及程度高。8特征提取:在特征提取过程中,输入数据中的低层特征被提取出来,经过分析而转化成包含手形语义的高层特征,然后用高层特征进行手形识别[6]。BP算法:是一种按误差逆传播算法训练的多层前馈网络。BP网络的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的

5、误差平方和最小。3BP算法BP神经网络是一种前向传播的多层网络,网络除了输入节点以外,还有一层或多层隐含节点。其训练方法被称为误差反传播算法,它利用实际输出和期望输出之差对网络的多层连接权由后向前逐层进行校正[7]。BP网络的最大缺点是样本训练的收敛速度慢。为提高网络的收敛速度,同时防止网络的振荡发散,本次选取的BP神经网络是1个3层BP网络结构(含1个隐层),隐单元及输出单元用sigmoid函数输出,输出共分为10类,即输出神经元个数为10。由于输入矢量为处理后的手部加速度传感器(用18×10的数字矩阵表示),因此第一层为240个神经元,第二层为隐含层。

6、根据经验,其神经元数目一般为输入矢量维数的10%,为26个神经元,采用改进的BP算法。将每个样本对应的矩阵元素值输入神经网络的各个输入单元,并为每个输出单元指定期望输出,计算每个输出单元的实际输出与期望输出的误差以及隐含层误差。计算实际输出与期望输出的误差公式为:8式中,Ek为期望输出,Ok为实际输出,k=0,1,2,…,9。将误差定义式展开到隐含层的公式为:网络输入误差是各层权值wjk、vij,即:(j=0,1,2,…,m;k=1,2,…,l)(i=0,1,2,…,n;j=1,2,…,m)式中的负号表示梯度下降,常数η∈(0,1)代表学习速率。由于BP神

7、经网络算法的收敛速度慢,优化的目标函数非常复杂,所以需要优化学习速率。三层感知器的BP学习算法权值调整计算公式为:将每个加速度传感器中每个轴的数据特征向量作为神经网络的输入,所以神经的输入层神经元个数等于特征向量的维数,即9×18=162个输入神经元。输出层神经元个数的确定因为要识别10个数字,因此输出选择为10×1的矩阵,即输出节点数为l0。当0~9输入神经网络后在输出神经元对应的位置上为1,其他的位置为0。输入数字0,第1个输出神经元为1,其他为0;输入数字1,第2个输出神经元为1,其他为0;依此类推。8隐含层数越多,神经网络学习速度就越慢。根据Kos

8、mogorov定理,在合理的结构和恰当的权值条件下,3层BP网络可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。