欢迎来到天天文库
浏览记录
ID:45292762
大小:1.37 MB
页数:108页
时间:2019-11-11
《5汉字输入技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第五章汉字输入技术延边大学计算机科学与技术系内容汉字输入技术概述汉字键盘输入技术汉字键盘输入系统Windows汉字输入技术Linux下的汉字输入系统一、汉字输入技术概述汉字输入发展史汉字输入分类汉字输入技术发展和应用1、问题提出早期,计算机主要通过键盘输入文字信息在计算机出现以前,西文打字机的键盘早已定型,计算机很自然地利用了打字机键盘这一录入工具。在键盘上没有汉字,那么如何才能将汉字输入到计算机中?2、大键盘方案设计一个汉字大键盘。这个汉字大键盘上有几千个按键,每个按键对应一个汉字,汉字按照偏旁部首在键盘上分区排列,以便于快速检字。大键盘的思想经过实践证明是失败的,它存在的问题主要是在键盘
2、上找字困难,不能输入键盘上没有的汉字,设备本身价格太高等。3、基于西文键盘的汉字编码输入这是到目前为止最成功的计算机汉字输入方法。汉字编码输入是最早的汉字输入方法,已知最早的计算机汉字编码输入始于20世纪50年代的俄汉机器翻译研究,但只能用电报码或四角号码做汉字编码。在大陆,1978年5月上海电工仪器研究所部工程师支秉彝创造了一种“见字识码”法,并被上海市内电话局采用,从而率先使计算机的汉字输入进入了实用阶段。在港台及海外,以“王安三角”为发端,陆续涌现出“仓颉”、“呒虾米”、“行列”、“唯物”等一大批繁体汉字输入法。进入80年代后,在联想汉字、四通中文电脑打字机之后中国的汉字编码出现了“万
3、马奔腾”的局面。在大陆涌现出了五笔、自然码、郑码、拼音、智能ABC、智能狂拼、纵横等上千种的输入法。4、语音输入用了多年的键盘输入方式,在1997年左右突然受到猛烈的冲击,各大厂商包括IBM、微软、摩托罗拉、中自、紫光等公司纷纷推出自己的非特定人语音输入系统或者连笔字手写输入系统。美国微软公司于1997年9月在北京推出中文非特定人连续语音识别系统ViaVoice。ViaVoice是目前在市场上占据统治地位的语音输入系统。5、手写体汉字识别输入通过书写汉字记录信息已经有几千年的历史,这也是使用汉字的中国人的普遍习惯,所以手写识别输入是符合中国人记录信息习惯的。在1997年以后就已经有基本实用的
4、手写汉字识别输入系统,其中佼佼者为中自公司的“汉王99”、摩托罗拉公司的“慧笔”和清华紫光公司的“紫光笔”等。6、印刷体汉字识别输入我国对印刷体汉字识别(简称OCR,OpticalCharacterRecognition)的研究始于70年代末80年代初,经过科研人员几十多年的辛勤努力,印刷体汉字识别技术的发展和应用,已经有了长足进步。清华大学电子工程系、中国科学院计算所智能中心、北京信息工程学院、沈阳自动化研究所等单位分别研制开发出实用化的印刷体汉字识别系统。清华大学电子工程系研制的清华TH-OCR产品,占据着最大的市场份额,代表着中文OCR技术发展的潮流。内容汉字输入发展史汉字输入分类汉字
5、输入技术发展和应用1、分类汉字的输入两大类:编码输入自然输入语音识别输入字形识别输入手写体识别输入印刷体识别输入2、键盘编码输入键盘编码输入首先把需要输入计算机的所有汉字用键盘上的若干个按键编码,这些按键组成的序列称为对应汉字的输入码。通过在键盘上输入某个按键序列,并由计算机中的输入系统把这个序列转换为对应的汉字,从而达到输入汉字的目的。优点:输入快速、无需添加额外设备缺陷:输入方式和人们使用语言文字的习惯不符、用户需要化额外的时间学习等。3、语音识别输入汉字语音识别输入利用产生声音的物理模型,通过语音分析手段,预先将一些语音的特征提取出来,并存储在处理系统中。当语音信号输入时,处理系统根据
6、对该信号所提取的特征参数和所存储的参考特征进行比较,通过逻辑判断方法和“距离”测量法对语音进行识别。3、语音识别输入(续)自然界的声音和人讲话的语音,都是模拟信号,不能直接输入计算机,因此在语音输入的过程中,我们必须通过语音卡(声卡)等设备,把模拟的语音信号转换为数字语音信号输入计算机。然后计算机利用程序对输入的数字语音信号进行统计、判断和识别,并最终把它翻译成计算机能够理解的汉字的内码信息。语音识别输入技术有着广阔的应用前景缺点:由于不同人的口音差别较大,语音的准确识别比较困难4、汉字识别输入汉字识别输入根据模式识别原理,通过汉字的字形信息识别,产生汉字的内码,实现汉字的识别输入。汉字识别
7、输入的原理是通过抽取代表未知汉字模式本质的表达形式与预先存储在计算机中的标准汉字的模式表达形式的集合逐一进行匹配,用一定的准则进行判别,找出最接近输入汉字的那个标准汉字。汉字识别输入技术可分为印刷体汉字识别输入和手写体汉字识别输入两大类。5、手写体汉字识别输入手写体识别输入方法把手写字的位置信息首先转换成二进制的数字编码信息,并对手写字进行智能化的识别,并产生与之匹配的数字编码的中文或英文字符,同时所产生的字
此文档下载收益归作者所有