MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf

MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf

ID:54016865

大小:171.01 KB

页数:5页

时间:2020-04-28

MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf_第1页
MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf_第2页
MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf_第3页
MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf_第4页
MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf_第5页
资源描述:

《MLDA+LDA手写汉字识别中一种两级LDA分类方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第4期广西师范大学学报,自然科学版VOl.24NO.42006年12月JOurnalOfGuangxiNOrmalUniversity,NaturalScienceEditiOnDec.2006MLDA+LDA,手写汉字识别中一种两级LDA分类方法杨端端金连文尹俊勋(华南理工大学电子与信息学院广东广州510640D摘要,线性判决分析(lineardiscriminateanalysisLDAD作为一种经典线性工具已经被广泛地运用在各种模式识别问题中为了降低参数估计误差对于LDA性能的影响我们提出了一种改进

2、的线性判决分析(mOdi-fiedlineardiscriminateanalysisMLDAD算法并运用到手写汉字识别中使得识别率有所提高G在此基础上针对大类别的汉字识别问题提出了两级LDA的手写汉字识别方法即MLDA+LDAG在对GB231280的1034个汉字类别的350套手写样本的实验表明这个两级LDA识别策略针识别率较最小距离分类器有着3.77%的提高较LDA+最小距离分类方法有1.71%的提高表明方法的有效性G关键词,线性判决分析;手写汉字识别;特征选择中图分类号,TP391.43文献标识码,A文章编

3、号,1001-6600(2006D04-0231-04汉字识别是模式识别的一个重要分支也是文字识别领域最为困难的问题之一它涉及模式识别~图像处理~数字信号处理~自然语言理解~人工智能~模糊数学~信息论~计算机~中文信息处理等学科是一门综合性技术G汉字识别中统计模式识别方法由于有良好的抗噪声~抗干扰的性能获得了广泛的应用而在运用统计方法解决汉字识别问题时为了减少内存消耗提高识别速度和提高识别率一般会在分类器的前端设计一个有效的特征选择器G因为第一特征选择器可以降低特征向量的维数减小模型的复杂度;第二好的特征选择器可

4、以去除无用的特征对分类器性能的影响从而提高分类器的识别率G实际上有很多方法可以用来做特征选择[12][3]的特征投影矩阵一种传统的方法G近年来该技术其中基于线性判决分析(LDAD在汉字识别领域得到了广泛应用[45]G然而LDA的参数统计估计的误差常常会对于LDA的性能造成影响G受改进的二次判决函数[6]的启发本文提出了一种改进的LDA(MLDAD算(MODFD通过特征值的平滑进而补偿参数的估计误差法它和LDA的区别在于通过平滑每个类别协方差矩阵中次要轴上的特征值对每个类别的协方差矩阵估计误差进行补偿G并在此基础上

5、针对大类别的汉字识别我们提出了两级LDA的手写汉字识别方法即MLDA+LDAG1MLDA算法1.1LDA简介LDA依据了已有的类别信息致力于寻找最能区分各类数据的矢量空间G在数学形式上说定义类内散度矩阵S和类间散度矩阵S如下,zbGNjGjjTTSz=EE(I-/jD(I-/jD;Sb=E(/j-/D(/j-/D(1Dj=1I=1j=1收稿日期,2006-05-31基金项目,国家自然科学基金资助项目(60275005D;新世纪优秀人才支持计划资助(NCET-05-0736D;微软亚洲研究院-华南理工大学联合研究项

6、目(D8061490D作者简介,杨端端(1980D男贵州关岭人华南理工大学博士研究生G通讯作者,金连文(1968D男贵州都匀人华南理工大学教授博士G232广西师范大学学报,自然科学版第24卷其中Ij是类别j的第z个样本,u是类别j的平均值,u是所有类别的平均值,C是类别个数,N是类别jzjj的样本个数O要得到LDA的变换矩阵W一种常用的方法就是最大化比率detIS如果S是非奇异矩lda,bI/detISzIOz阵,那么要使比率detIS达到最大值,只需求出矩阵S-1的特征矢量,选取最大的g个特征值bI/detIS

7、zIzSb对应的特征矢量作为列向量构成变换矩阵W新的特征矢量可以表示为,lda,Tz=WldaIz(z=1,2,,N)O(2)其中I为f维的列向量即原始的特征,W为fg的变换矩阵,WT为W的转置,为g维的列向量O需zldaldaldaz要注意的是,采用LDA最多有C-1个非零的特征矢量,因此子空间最多是C-1维O1.2MLDA方法改进的二次分类器(MCDF)首先被KimUfa等提出来[6],已经成功地运用在汉字识别中O它通过特征值平滑改进标准二次分类器(CDF)的计算效率和分类性能O二者的区别在于MCDF中较小轴

8、上的特征值被设置为常数,如此做的动机在于试图补偿有限样本的估计误差O这样的估计误差同样在LDA算法中存在,从上一部分LDA算法来看,类内散度矩阵实际是每个类别的协方差矩阵之和,而对于有限个样本而言,每个类别的协方差矩阵不可能估计得完全准确O本文试图类比MCDF算法,对LDA算法进行改进,补偿估计误差O假如第j个类的协方差表示如下,NjjjTEj=(1/Nj)(Iz-uj)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。