硬刷题汉字识别技术的研究论文

硬刷题汉字识别技术的研究论文

ID:6198234

大小:1.02 MB

页数:51页

时间:2018-01-06

硬刷题汉字识别技术的研究论文_第1页
硬刷题汉字识别技术的研究论文_第2页
硬刷题汉字识别技术的研究论文_第3页
硬刷题汉字识别技术的研究论文_第4页
硬刷题汉字识别技术的研究论文_第5页
资源描述:

《硬刷题汉字识别技术的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硬刷题汉字识别技术的研究毕业论文目录摘要iABSTRACT.i目录iii1绪论11.1印刷体汉字识别技术的研究意义11.2印刷体汉字识别技术的研究状况11.3印刷体汉字识别技术存在的难点22印刷体汉字识别的概述42.1印刷体汉字识别的原理简介42.2印刷体汉字识别的流程简介43印刷体汉字识别技术的研究63.1预处理63.2汉字特征提取83.3汉字识别算法分类93.4后处理113.5印刷体汉字识别方法分析123.5.1结构模式识别方法123.5.2统计模式识别方法123.5.3人工神经网络143.5.4BP神经网络153.5.5支持向

2、量机173.6本章小结184系统的Matlab仿真194.1系统的分析194.2系统的实现204.2.1特征提取204.2.2BP神经网络的建立214.2.3BP神经网络的训练214.2.4系统的仿真234.2.5系统性能的进一步验证274.2.6仿真结果分析314.3本章小结325未来展望与全文总结33ii5.1未来展望335.2全文总结33参考文献35致谢36参考附录37参考附录137参考附录248ii49印刷体汉字识别技术的研究1绪论1.1印刷体汉字识别技术的研究意义汉字已有数千年的历史,是中华民族文化的重要结晶,闪烁着中华人

3、民智慧的光芒。同时也是世界上使用人数最多和数量最多的文字之一。在跨入信息时代后,现如今汉字印刷材料的数量大大增加,一些专业单位如新闻社、图书馆、古籍出版社、档案馆等所接触的印刷材料更是浩如烟海,信息量均是呈爆炸性增长,毕竟阅读印刷材料更为符合人的自然阅读习惯。然而,随着人们对电子化信息需求的日益增加,如何将汉字快速高效地输入计算机,是信息处理的一个关键问题,也是关系到计算机技术能否在我国真正普及的重要前提,更是能否传播与弘扬中华民族悠久历史文化的关键因素。传统的人工键入不仅速度慢而且劳动强度大,即使是专业的打字员每分钟也只能输入10

4、0-120个汉字。这种方法不适用于需要处理大量文字资料的办公自动化、文档管理、图书情报管理等场合。而且随着劳动力价格的升高,利用人工方法进行汉字输入也将面临经济效益的挑战。人们要求有一种能将文字信息高速、自动输入计算机的方法,于是印刷体汉字识别技术便应运而生。这种快速,准确的自动处理方式将在很大程度上推动我国信息化的发展进程,对社会各方面的工作都有着相当深远的意义。目前印刷体汉字识别技术已经呈现出了广泛的应用前景,它主要应用在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域。汉字识别是模式识别的重要应用领域,也是光学字符识

5、别OCR(OpticalCharacterRecognition)的重要组成部分。汉字识别是一门多学科综合性的研究课题,它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等技术都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具;另一方面,它的研究与发展也必将促进各学科的相互进步。因而该技术有着重要的实用价值和理论意义。同时,中国是使用汉字最久远和最广泛的国家。因此,能否在汉字识别技术的研究方面占据领先的位置也是中国科技实力的一项至关重要的体现。1.

6、2印刷体汉字识别技术的研究状况上海应用技术学院电气与电子工程学院毕业论文49印刷体汉字识别技术的研究印刷体汉字识别是文字识别技术的一种。利用机器识别文字符号,可以说从1929年奥地利科学家陶舍克利用光学模板匹配识别开始。当时,他使用了10块模板对应10个数字,依次把待识别的数字投影到这10块模板上,当模板透过的光达到最小时(数字遮挡了模板的透光部分),数字就被识别成这块模板上的数字。大约在50年代末60年代初,就已经出现了关于利用计算机识别数字及英文符号的研究论文。据文献记载,印刷体汉字的识别最早可以追溯到60年代中期。1966年,

7、IBM公司发表了第一篇关于印刷体汉字识别的论文,在这篇论文中他们利用简单的模板匹配法识别了1000个印刷体汉字。随后,日本也在70年代开始对汉字识别进行了研究。1981年5月在日本第56届商业展览会上,富士通研究实验室进行了手写印刷体汉字识别的公开表演。1984年日本武藏野电气研究所研制成多体印刷汉字识别装置,可以识别2300个多体汉字的印刷体汉字识别系统,识别率为99.88%,识别速度大于100字/秒,代表了当时汉字识别的最高水平[1]。此外,日本的三洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统,但因这些系统价格极其昂贵

8、,没有得到广泛应用。直到80年代中期以来,以软件为主并使用通用高档微机的产品才逐步走向市场。同国外相比,我国的印刷体汉字识别研究起步较晚[2]。我国在20世纪70年代才开始对数字、英文字母及符号的识别技术进行研究,20世纪70年代末仅

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。