欢迎来到天天文库
浏览记录
ID:38366559
大小:216.00 KB
页数:10页
时间:2019-06-11
《基于BP神经网络的鼠标手势识别》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《模式识别》课程学习报告2011秋季学期姓名:学号:专业:2011年11月基于BP神经网络的鼠标手势识别摘要:鼠标手势是指用鼠标做出一些动作以控制软件完成某些操作。由于其方便快捷的特点,鼠标手势已经被越来越多的软件采用。本文介绍了一种基于BP神经网络的鼠标手势识别方法。文中首先将常用鼠标手势进行抽象,建立其基本模式单元,然后引入BP神经网络基本方法,建立了抽象模单元与鼠标手势的对应关系,最终完成了常用鼠标手势的软件识别。文章最后给出了基于matlab的仿真实例,分析方案实现效果及不足,并提出了相应的改进方案。关键词:BP神经网络鼠标手势matlab一.
2、引言鼠标手势(MouseGestures)最早从Opera浏览器借鉴而来,简单地说,就是用鼠标做出一些动作以控制软件完成某些操作,就好比人们见面时打的手势一样。目前主要在浏览器软件中得到比较广泛的应用,一般是按住鼠标右键,并在网页的空白处划出某种特定的轨迹,然后即可实现预先定制的前进、后退、刷新、关闭窗口等常用操作。 需要说明的是,一方面由于鼠标移动轨迹设计精度的限制,另一方面由于计算机对鼠标轨迹识别的准确度还有待提高,因此现在的鼠标手势还比较简单。不过,如果使用得当,你将会发现使用鼠标手势比键盘上的快捷键甚至还要来得方便。鼠标手势识别可以看作是字符识
3、别,字符识别一般通过基于字符结构的识别法及模板匹配法来进行处理,前者一般更适用于字母和数字的识别;后者程序实现起来比较容易,但识别精度不高。为了提高识别率,就必须寻求新的方法和途径。近年来,BP神经网络技术取得了巨大发展,它是一种前馈型神经网络,具有分布式存储信息、并行处理信息、自组织、自学习信息等优点。本文通过对BP神经网络的学习,利用有效的BP算法完成了鼠标手势识别系统。二.BP神经网络模型概述人工神经网络是一种模拟人体大脑神经系统结构和功能,由大量简单人工神经元广泛连接构成的人工网络。1943年,美国生理学家WcCulloch和数学家W.Pitt
4、s总结生物神经网络的特性,继而提出了最早的神经元模型—MP模型,建立了人工神经网络的理论研究。1986年生理物理学家Rumelhart、Willianms等提出了反向传播算法,形成了BP神经网络。由于网络结构的简单性与稳定性,在实际应用中一般都采用BP神经网络(Back-propagationNetwork,简称BP网络)。BP网络模型的多层感知器是应用最广泛的神经网络,在多层感知器的应用中,以单隐层网络的应用最为普遍。因此我们选择最常用的三层前馈BP神经网络。图1为3层BP神经网络示意图,它实现n维向量Xn=[x1,x2,…xn]T,到m维向量Ym=
5、[y1,y2,…yn]T,的非线性映射。网络参数包括输入层到隐层的权重、隐层到输出层的权重、为隐含层第j个神经元的阈值、是输出层第k个神经元的阈值。网络训练前随机生成权重和阈值的初值。假设训练样本集S有P个训练样本:是n维向量,是m维向量。S对应的目标模式集为:输入训练样本,信息首先向前传播到隐含单元,经激活函数作用得到隐含层的输出信息:激活函数f(u)一般采用S型:输入输出XnYn信息(误差)传播方向图1BP网络示意图隐含层信息传到输出层得到最终输出结果:三.BP神经网络的鼠标手势识别过程BP神经网络鼠标手势识别过程由手势模式预处理和鼠标手势识别组成
6、。鼠标手势预处理对手势图像进行一系列的变换后把最后提取到的样本的特征向量送到数字识别系统中,然后进行识别并给出结果。BP神经网络的鼠标手势识别过程如图2所示。图3常用鼠标手势字符输入输出XnYn信息(误差)传播方向图1BP网络示意图训练样本读入预处理特征提取BP神经网络的训练期望输出(教师信号)(a)BP神经网络训练过程待识别样本预处理特征提取BP神经网络识别识别结果输出(b)BP神经网络识别过程图2BP神经网络识别系统鼠标手势已经涵盖了多数英文字母和数字,其中常用的英文字符如下:图4鼠标手势0到9的数字本文中没有考虑以上的全部字符,所考虑的待识别鼠标
7、手势为0到9的数字图4鼠标手势中的抽象数字图形,如图4。.3.1图像的预处理图像预处理是图像问的变换处理,是图像分析的前期准备,目的是使图像中描述客体特征的图像更加简练、独特性更强、信息少而唯一。本文对手写数字图像样本进行了灰度化处理、二值化处理、去离散噪声、归一化调整等预处理。其中二值化处理利用graythresh函数得到图像的全局阈值,然后使用im2bw将灰度图像转换为二值图像。程序代码为:Threshold=graythresh(fig_gray);Fig_bool=im2bw(fig_gray,threshold);其中fig_gray和fig
8、_boo1分别为灰度图像的存储矩阵和二值化图像的存储矩阵。归一化处理将图片归一化为20×36像
此文档下载收益归作者所有