手写数字识别的一种新的视觉模型

手写数字识别的一种新的视觉模型

ID:8205615

大小:223.00 KB

页数:9页

时间:2018-03-10

手写数字识别的一种新的视觉模型_第1页
手写数字识别的一种新的视觉模型_第2页
手写数字识别的一种新的视觉模型_第3页
手写数字识别的一种新的视觉模型_第4页
手写数字识别的一种新的视觉模型_第5页
资源描述:

《手写数字识别的一种新的视觉模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、手写数字识别中的取取线性可分特征的一种新的视觉模型简介我们使用成熟的生物视觉模型构造一个新的视觉模型用于手写体数字识别。通过大量的数据(MNIST数据似集)进行训练后显示,本模型提取的特征是线性可分的。仅使用线性分类器,虽然我们的模型相对比较简单,但是在相同的数据集进行测试是,我们的模型表现得更好。1引言在近十年中,手写数字的识别一个个非常活跃和发快速发展的领域。在近几年中了版了大量关于特征提取和分类的技术文献,因此关于此主题的文献有很多。特征提取取范围从何特征到曲线斜率特征,而分类技术从模板匹配到神经网络多有很多种。一些是来源于生物学基础,还有

2、一些则是基于统计学或几何的特征。特征提取主要有两种方法。传统的方法是手工的特征提取,与此不一样的是通过一个特征提取算法对原始数据进行学习以此发现数据中的固有特征。每一种方法都有它自己的优点的缺点。在前一种方法中,主要的困难在于确定特征的分类,以及特征提取的一种稳定可靠的方式。对于特征的自动学习,只有在每一个分类都拥有大量的样本才可行,因此对于日文或中文字符,它可能不适用,因为每一个分类没有那么多的样本。此外,在自动特征提取模型中,比如人工神经网络,它通常很难分析或辨认特征,并且还会受到自身激活函数和学习算法的约束。比如,如果特征通过非可微的或非连

3、续的函数提取,则它将不能学习梯度下降的数据。这就是为什么,尽管有可用的特征提取算法,但是特征提取领域的研究仍然很活跃。我们基于如下原则着手开发一套用于手写数字识别的视觉系统:(1)生物学基础这是用在计算机视觉中一个古老又成功的原则。毕竟,生物视觉系统是我们知道的最稳定的识别系统,因此它值得我拉去效访。在我们的系统中,我们尝试覆盖尽可能多的当前已知的生物学系统中的特征。(2)线性可分性特征提取的一个关键要求是减少分类中的变化,提高类间的变化,一衡量的性的标准就是线性可分性。通过使训练数据线性可分,我们只需要使用一个简单的快速进行训练和不容易出现问题

4、(比如过拟合,本地最小值)的线性分类器过行训练。在手写数字识别中,除非数据非常小,否则要取得个线性的数据是非常难的,因为手写数字的样式太多。非混淆视听上有意义的是我们的系统在60000数据集的情况下达到了此要求。(3)清晰的语义知道特征所代表的意义不仅对目的的说明很有帮助,而且可以促进进一步的分析。通过显示的的提取很明确的特征,我们的模型能表达出明确的意义。2发展中的模型与传统的模式识别系统一样,我们的模型由两个部分组成:从图片中提取特征向量的特征提取器,能够通过特征向量确定其输出分类的可训练分类器。特征提取的一个关键的步骤是在前面所提到的原则下

5、决定要提取哪些特征。生物视觉系统以它能提取大量的空间特征而为人所知,比如:边、线、角、长度和宽度。我们选择提取边和方向角,因为与此相关的领域很多。此外,可视化系统能区分明亮和灰暗的特征,正如关于在非中心及偏离中心的文献中所证明的那样。因此我们选择实现一个双通道的系统。下面的小节详细介绍了特征提取的过程。2.1特征提取空间特征通过几个简单的步骤从原始图像中提取。如下图:上图是特征提取过程。原始图像是一个用I标记过的二维的图片,图片在坐标(x,y)的灰度值由I(x,y)给出,它的范围从0到时最大灰度值之间变化,灰度值是0代表背景。原始的输入数据都会进

6、行单位化以便计算和,它对应于本视觉系统中通道的开与关。和由如下式计算:我们发现双通道系统与单通道系统在分器的精度上有一定的优势。然后通过一个较小的值进行卷积的计算。这相当于有一个在本地可接受的区域,此发现来源于生特征视觉系统,即基本的特征从闭合的拓扑结构中的一个小的子集中提取。这使网络能够利用空间拓扑结构检测图像中不同位置中具有相同空间的特征。我们用Qh来表示卷积映射,使用指定相应的掩码或内核可接受圆形区域(半径为2)。卷积从如下两种方式进行计算:每个卷积和还要经过一个分段线性函数f进行计算。所有这些特征映射的值都是非负值,它表示了此特征值的重要

7、性。分段线性函数的输出值再乘以中央像素值。我们发现这是一个减小错误边和角的即简单又有效的方法。在实际情况中,只有一个卷积需要传递掩码,因为:我们使用的16位模板掩码如下图所示:这些模板掩码是视觉皮层中简单超复数可接受领域中和简单模型,它们用于检测不同方向上的边缘和结束点。此模型也可以通过合适的中心和半径使用高斯线性组合函数完成。但是我们发现使用整数掩码代替会精确。使用终端抑制滤波器来检测打开通道的凸角,相反也使用它们在关闭通道检测凹角。众所周知如果移除角或曲率信息会降低人工识别的精度,但是如果移除线信息则不会。事实上我们发现角是比线更重要的特征,

8、如是包含角信息识别的效果会更好。功能聚合和像素欠采样相似,用于减少特征的数目,否则特征的数目会太多。我们反欠采样和特征聚合分开。在欠采样

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。