汉字篆字识别系统文献综述.docx

汉字篆字识别系统文献综述.docx

ID:53261092

大小:55.91 KB

页数:5页

时间:2020-04-02

汉字篆字识别系统文献综述.docx_第1页
汉字篆字识别系统文献综述.docx_第2页
汉字篆字识别系统文献综述.docx_第3页
汉字篆字识别系统文献综述.docx_第4页
汉字篆字识别系统文献综述.docx_第5页
资源描述:

《汉字篆字识别系统文献综述.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、汉字篆字识别系统文献综述机械工程学院研班吴金明概述汉字识别是用计算机自动辨识写在纸(或介质)上的汉字,是智能计算机接口的一个重要组成部分,也是中文信息处理中汉字自动、高速输人的一种最重要手段.作为模式识别和人工智能学科的一个分支一文字(汉字)识别技术在我国自年代末起步,至今已有多年了,目前正向实用化大步迈进。在本文中所要解决的问题是对汉字中的篆字进行识别,对于汉字篆字识别系统目前国内还没有成熟的研究,但是其基本原理同其他字体的识别相似。篆字是很古老的一种汉字,在我国汉文字发展史上,篆字是大篆、小篆的统称,亦称篆书。大篆指甲骨文、金文、籀文、六国文字,它们保存着古代象形文字的明显特点。小

2、篆也称“秦篆”,是秦国的通用文字,大篆的简化字体,其特点是形体匀逼齐整、字体较籀文容易书写。它是大篆由隶、楷之间的过渡。所以研究篆字文化具有十分重要的历史意义。掌握了篆字的特征是汉字识别很重要的前提。目前,对于汉字识别系统应用最广泛的就是光学字符识别(),自从年取得光学字符识别()专利以来,经过近一个世纪的发展,已经成为当今模式识别领域中最活跃的研究内容之一。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并在计算机及其相关领域中得到了广泛应用。汉字识别过程大体如下:光学字符识别方法及分类光学字符识别过程首先使识别设备学习、记忆将要辨识字符的特征,使这些特征成为识别系统自身

3、的知识,然后再利用这些先验知识对输入图像进行判决,得到字符的识别结果。字符的特征不仅仅局限于平面上的点阵位置信息,在频率空间、投影空间,甚至语义空间字符都有各自的特征。这些特征在识别字符时又有各自的特点及优势。根据识别字符所采用具体特征的不同便衍生出了不同的识别技术。通常,根据不同的技术策略,识别方法可以分为如下类:统计特征字符识别技术、结构字符识别技术和基于神经网络的识别技术。光学字符识别的近期发展.采用激光作为扫描光源。这是因为激光光束集中,方向性强,扫描光点极小,因而能显著地提高分辨能力。另外,激光光源的寿命比普通光源长许多倍,光学系统比较简单,不需要特制的高精度高压电源,因此,

4、其造价也可大幅度降低。但其缺点是扫描系统大都采用机械式的光点偏转机构,对激光束控制不够灵活,扫描速度较慢。除激光扫描法外,还有用半导体光敏元件组成的二维面板来实现光电转换的。其原理是将照射在纸面上的反射光加以放大,或用光导纤维投影到光敏元件板上,从而对文字进行顺序扫描,并产生相应的输出电信号。半导体光敏元件具有寿命长.稳定性高,结构简单,扫描速度快等优点。与传真扫描技术相结合。这就是用来识别页面上的文字,用传真扫描技术来扫描图像,然后再用信息压缩技术将信息进行压缩。在这种情况下,计算机既能接收可识别文字的标准编码,也能接收传真扫描的图像信息。这种由与传真扫描相结合的机器,已由美国公司制

5、造出来了,别的公司也有同类的装置,用在建立电子文档上。.在软件设计方面,使用了识别逻辑,从而改进了文字的特征抽取与判决的方法,增加了可识别字符的种类,提高了识别速度,降低了误识率与拒识率,因此改进了数据输入的质量与灵活性。.对汉字字符识别的研究,尤其是对手写体汉字识别技术的研究工作十分活跃。如日本东芝公司在年首先研制成功了可识别个印刷体汉字的样机,输入速度为字符秒,基本达到了实用水平。接着,日立公司也相继研制成功了同类的样机。在手写体汉字识别方面,仅日本发表的特征抽取方式就达数十种,虽然许多问题尚待解决,但一般预测在年代内会达到实用水平。.实现的标准化。其中包括可识别的字符字型与字号的

6、标准化,字符编码的标准化,打印质量与打印规格的标准化,打印用纸与油墨的标准化。的标准化工作对于评比各类设备的性能与提供适合用的文件方面都具有重要的意义与作用,并将使这项技术得到进一步的推广与应用。光学字符识别技术的展望()基于模糊技术的识别方法由于字符本身,特别是手写字符,在字型字体上的变化很大,导致在文字识别中存在着很大的不确定性,因此模糊数学的观念便很自然地被引用到了模式识别领域中。年等人提出了一种景物标识松弛算法,年,等人运用模糊集的理论对复杂图像进行了分析,实现了运动目标的检测,同时开始了模糊数学在图像识别中的应用。朱学芳等通过对文字中直线、折线和圆进行模糊定义,提出了一种无约

7、束的手写数字识别方案,有效地克服了手写数字变化大的问题。()结合语义理解的后处理技术与识别前的预处理相对,可以对识别的结果进行后期处理,提高识别的正确率。分析人类在识别文字的过程,文字一般都是结合上下文进行理解的,因此,计算机在识别文字时也可以在识别单字的基础上,结合单字的上下文信息对识别结果进行校正,以单词甚至句子作为一次识别的结果。依据对语言文字的统计信息,可以确定某个文字后可能跟随的候选字符集,达到缩小搜索范围、简化计算的目的。基于这个原

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。