基于主成分分析的手写体数字识别方法探究

基于主成分分析的手写体数字识别方法探究

ID:20735551

大小:82.00 KB

页数:8页

时间:2018-10-15

基于主成分分析的手写体数字识别方法探究_第1页
基于主成分分析的手写体数字识别方法探究_第2页
基于主成分分析的手写体数字识别方法探究_第3页
基于主成分分析的手写体数字识别方法探究_第4页
基于主成分分析的手写体数字识别方法探究_第5页
资源描述:

《基于主成分分析的手写体数字识别方法探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、0.引言随着计算机技术的发展,人类对模式识别技术提出了更高的要求,特别是对于纸质的手写材料,如印刷材料、手稿等,计算机自动识别输入成为必须的研究课题。手写体数字识别在财税、金融、邮寄分类、数据统计等领域有着广阔的应用前景。在手写体数字识别领域中,由于同一数字的形状数不胜数,对此不能直接根据数字形状进行识别,在识别前需要进行特征提取。特征提取质量的好坏必然影响到字符的识别。针对如何从模式中提取最有效的鉴别特征,学者们已经提出了多种方法。其中,主成分分析(PrincipalComponentAnalysis,PCA)被认为是一种经典的特征提取方法。它的目标是在低维子空间中表示高维数据,使得在最小误

2、差平方和的意义下,低维表示能够较好地描述原始数据。正因为它在理论和实践中的简洁易行,同时能减小冗余信息和计算量,所以在对象识别和应用在得到了广泛的应用。然而在手写识别系统领域存在一定的问题阻碍着实现特征提取。如每个书写者的书写风格、外来干扰等。PCA方法由于在对外来干扰和数据描述的有限性的限制下,很难精确地描述那些复杂的非线性的手写体数字特征。为了消除这些缺点,提出改进的PCA方法,即基于距离核的PCA设计一个高效的手写数字识别方法。距离核的主成分分析不仅可以清晰地描述高斯分布的数据,而且可以很好地描述非高斯分布数据。首先,针对PCA的不足,提出对其的改进方法-S巨离核PCA方法并描述其方法的

3、原理。然后,把改进方法创新性皮用在手写体数字识别领域。最后,使用支持向量机作为分类器,在MNIST手写体数据库中验证该算法的可行性与识别率,1.基于距离核的主成分分析主成分分析(PrincipalComponentAnalysis,PCA)是一种经典的特征提取方法,它来源于K-L变换。PCA通过计算样本协方差矩阵的本征矢量线性地将输入空间映射为低维的特征空间,并且得到的新特征之间互不相关。作为一种线性方法,PCA已在多个领域得到了广泛的应用。但对于真实图像中存着的复杂的非线性变化,如光照、尺度、扭曲等,该方法不能对其进行充分地描述。针对这个问题,提出核主成分分析方法。1.1核主成分分析算法描述

4、核主成分分析(KernelPCAzKPCA)z主要思想就是把核方法和线性主成分分析方法结合起来,首先利用一个非线性映射将原始特征空间中的数据映射到高维特征空间中,然后在高维特征空间中进行主成分分析。其基本原理如下:给定一组训练样本xl,x2,…,xI,用(xk)表示输入空间,相应的映射为①,核函数通过映射①将隐式的实现点x到F的映射,投影后的数据集变为{

5、eF{0},Rp=Ap.由于此时的数据集为

6、J=Ili=laiO)(xi)(4)其中,cd(i=1,,I)为系数。则有:Zli=lai(Zlj=1(0(xj)-

7、<...

8、,p,i=1,…,1(10)其中,K(z,X)=(k(x,xl),k(x,x2),,k(x,xM))T,在aki中,i是特征向量ai的第i个系数,k是矩阵K的第k个特征值。(3是提取的第K个主成分。如果(1)是不确定的,核函数K可修正为:Kij—Kij-ll(Ilw=IKiw+Zlw=lKwj)+1I2IIwzr=lKw(11)如上所述,核主成分分析是通过非线性函数把输入空间映射到高维空间,并在高

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。