欢迎来到天天文库
浏览记录
ID:53750355
大小:240.60 KB
页数:3页
时间:2020-04-23
《手写汉字识别系统的研究与应用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、武昌理工学院学报2014年第2期第9卷第2期总第3l期手写汉字识别系统的研究与应用刘庆祥(武昌理iT_学院,湖北武汉430223)摘要:本文在研究汉字识别理论的基础上,介绍了手写汉字识别系统研究的意义及其在实际中应用,并对当前手写汉字识别的现状及存在的问题进行了分析,提出了限定性脱机手写汉字识别的研究方向。关键词:限定性;脱机手写汉字;模式识别;人工神经网络中图分类号:TP391文献标识码:A一使得计算机能够自动地将汉字图象转换为汉字内、引言码。设G为汉字图象的集合,c为汉字集合,则汉以计算机为基础的现代信息处理技术已成为信字识别问
2、题可以看作一个映射(如公示一所示):息社会的重要标志,随着信息时代的到来,如何用公式一:f:G-+C或c=f(g)计算机对汉语信息进行处理已发展成为一门综合性其中g∈G为一个汉字图象,C∈C为其所对的交叉学科——中文信息处理。汉字信息的计算机应的汉字内码。处理技术对我国乃至世界信息事业的发展具有重要但在现有的识别系统中,这种映射还不是一一的意义,在以微电子与计算机技术为先导的信息化对应的关系。其原因在于就现有的机器识别技术,浪潮中,成为我国高新技术的一个热点。还不能作到对识别结果的完全确定,存在误识和拒汉字信息的计算机处理技术包括汉
3、字信息的输识问题。人、处理和输出。汉字是一种象形文字,它不像西为了评价一个识别系统的性能,通常引入识别方拼音文字那样可以直接方便地输人到计算机中,率、误识率、拒识率和识别结果可信度的概念。虽然现在已有数百种的汉字输人编码方案,但它们识别率指汉字识别系统能够正确识别的字数与不是速度慢就是过于复杂不便学习,难以适应高速待识别的总字数的比率;发展的中文信息处理技术的需要。汉字输入问题成误识率指汉字识别系统错误识别的字数与待识为汉字信息处理的“瓶颈”,影响了计算机在我国别的总字数的比率;的推广使用,成为我国乃至世界信息化进程的障碍。拒识率指
4、汉字识别系统不能够识别的字数与待研究高速自动的汉字输入方法是中文信息处理技术识别的总字数的比率;领域的一个重大课题。汉字自动录入的关键是汉字识别结果的可信度是指识别器输出汉字C时的的计算机自动识别问题。可信程度。若被识别器识别汉字c的总字数是Mc,二、汉字识别及其研究的领域对应Mc中输人汉字c的个数为Nc,则C的可信度Bc用公式二表示。汉字识别是指让计算机对经由某些特定输入设公式二:Bc=(Nc/Mc)X100%备得到的汉字图象进行自动识别,从而得到相应的为了减小研究难度,集中研究精力,人们对汉计算机内码表示的汉字文本的一种技术。它
5、是智能字识别研究领域进行细致的划分。依照待识别汉字计算机接口的一个重要组成部分,也是汉字高速、的形成方式,汉字识别可分为印刷体汉字识别和手自动输入计算机的重要手段。汉字识别系统有时也写体汉字识别两大类。手写体汉字识别又可根据识称为“光学字符阅读机”,简记为0CR(Optical别的实时I生分为联机手写体汉字识别和脱机手写体CharacterReader)。汉字识别。对脱机手写体汉字识别又分为特定人非形象地来讲,汉字识别就是在汉字图象(或笔限定性脱机手写体汉字识别、非特定人限定性脱机画序列)与汉字的计算机内码之间建立一种关系,收稿日期
6、:2014—02—26作者简介:刘庆祥(1948一),男,湖北荆门人,武昌理工学院信息工程学院教授。121武昌理工学院学报(科学与技术)2014年第2期手写体汉字识别和非特定人随意性脱机手写体汉字与低层智能的结合部,能够部分为意识所觉察和描识别。述。联机识别指手写体识别时,用光电书写板边输(三)人类的习字与识字的过程是一个典型的入边识别,各笔迹点的坐标被顺序地输人计算机内,学习训练过程,对于机器学习算法的研究很有意义。原始信号为一维序列;而脱机识别研究的对象是书(四)由于手写体汉字识别是一个涉及多学科写在纸上经由扫描仪输入的点阵字符
7、,原始信号为的复杂性问题,各个学科从自身角度探索手写体汉字二维图象。因此从识别的角度看,联机手写识别要识别问题,出现了大量新思想和新方法,促进了相关比脱机手写识别简单,因为在联机识别中容易抽取学科的深入发展,因此手写体汉字识别在相关学科研笔划和笔顺信息。究中,具有很高的理论探索价值和启发创造作用。所谓“限定性”是指手写印刷体识别时,要求手写体汉字识别不仅具有重要的理论研究价人们工整书写,例如书写时要求横平竖直;而“非值,而且具有广阔的应用前景。手写体汉字识别技限定性”是指人们在实际生活中那样可以连笔地自术的应用是多方面的,它能使习惯
8、汉语的计算机用由书写。户保持传统的书写方式,又享受到计算机给人们带目前印刷体汉字识别和联机手写体汉字识别己来的快捷和便利,该技术的应用和发展必将彻底改逐步实用化,而脱机手写体汉字识别,因其自身的变人机界面的传统模式,加速计算机在使用汉
此文档下载收益归作者所有