汉字输入技术与方法.doc

汉字输入技术与方法.doc

ID:51072490

大小:41.00 KB

页数:13页

时间:2020-03-09

汉字输入技术与方法.doc_第1页
汉字输入技术与方法.doc_第2页
汉字输入技术与方法.doc_第3页
汉字输入技术与方法.doc_第4页
汉字输入技术与方法.doc_第5页
资源描述:

《汉字输入技术与方法.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第三章汉字输入方法?文字录入是中文信息处理的第一步,它可以借助三种手段来实现,即键盘输入、汉字字形识别和汉字语音识别。?在这三种方式中,汉字的键盘输入是主流的输入方式,而汉字字形识别输入和语音识别输入是汉字输入发展的一个趋势,将来的输入技术将是一个多元化的格局。第三章汉字输入方法第一节汉字键盘输入?汉字的键盘输入可分为两种基本的形式:?一是通过专用的大键盘来进行整字的输入,其效率低下,成本高,已经基本不用。?二是通过标准的PC键盘(小键盘)来进行输入,显然,要完成输入过程,就必须对汉字进行编码,因

2、此小键盘的输入是一种编码输入。其效率高、成本低,已经成为主流的输入方式。第一节汉字键盘输入?如前所述,依据编码的思路不同,可将编码分为流水码、拼音码、拼形码、音形结合码四类。?每一种编码都有其特点,在键盘输入方面,目前的格局是职业打字员使用形码(如五笔字型),非职业打字员使用音码(如全拼),音码向智能化方向发展,相对形码而言优势越加明显。当前音码的主要不足是不能实现盲打。将音字转换从语句级拓展到篇章级可以解决盲打问题。因而可以肯定∶音码输入加智能转换,将成为未来键盘输入的主流。现在主要的问题在于如

3、何提高转换精确度。第一节汉字键盘输入?汉字键盘输入系统是由编码层次和软件层次两部分构成,这两个层次互相补充,互为依托,构成完整的输入系统。从“高频先见”、“联想”到“自动识别重码字、词”,软件智能化的程度在不断提高。?赋予计算机一定的有关汉字、汉语的语法、语用知识,计算机可根据这些知识来取代原来需要人脑记忆的某些编码规则,辨别同音字和人工选定重码字、词或联想字、词。第一节汉字键盘输入?一、流水码的代表:内码输入法?内码输入法是Windows内置的一种输入法,它支持区位码、GBK内码、UNICODE

4、码三种方式的输入。第一节汉字键盘输入??区位码的前二位是区码,后二位是位码。区的编码是从01-94,位的编码也是从01-94。在区位码输入方式下,键入相应的区码和位码就可以输入一个汉字。汉字是从16区到87区,01至15区是图形符号和字母。区位码输入支持《信息交换用汉字编码字符集--基本集》即GB2312-80的内码输入方式。内码编码的范围为:0xA1A1~0xFEFE。?GBK内码输入覆盖了汉字扩展内码规范--GBK中规定的全部汉字。?UNICODE码输入支持《通用多八位编码字符集(UCS)》-

5、国际标准ISO/IEC10646.1-1993中规定的全部汉字。第一节汉字键盘输入??可以输入所有的汉字,包括所有的符号,和内码一一对应,只要内码支持多少汉字,它就可以输入多少字。如在OfficeXP的简体中文版中,可以达到对6万多汉字的输入支持。?对于不认识字的字也可以输入,可以通过偏旁部首对照表来进行???安装OfficeXP简体中文版,Microsoft在中文简体版OfficeXP及相应多语言包中,专门开发了超大字符集中文字体(宋体-方正超大字符集)及增强型区位码。?宋体-方正超大字符集字体

6、包括了27,564个汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。?宋体-方正超大字符集中包括了6万4千多汉字,但是由于其中相当多的汉字读音很难确定,使得按拼音输入的方法难以实现。为此,微软公司专门扩展了原区位/内码/Unicode输入法,开发了增强型区位码。对于GBK中的汉字(即在Unicode中U+4E00~U+9FFF),用户可以继续按原来的方式输入(

7、通过输入区位码,GBK内码或Unicode码)。但是对于扩展A的汉字只能通过输入Unicode码,对于扩展B只能通过输入一种4字节的Surrogate码。总之,通过增强型区位码用户不仅可以输入GBK的汉字,而且可以顺利输入扩展A及扩展B的汉字。?用户只需就要查找汉字在《康熙字典》(或《汉语大字典》)中相应的页码(《康熙字典》的xxxx.xxx或《汉语大字典》的xxxxx.xxx),并在搜索中将该页码字符串作为关键字进行搜索,找到相应的Unicode或Surrogate,然后激活增强区位输入法即可进

8、行输入。?《康熙字典》页码格式为:xxxx.xxx《汉语大字典》页码的格式为:xxxxx.xxx。这里特别要注明的是这里数据来源于1958年1月第一版的《康熙字典》。?这里小数点前为该汉字在字典中的页码,小数点后两位为该汉字在该页中的位置。如果最后一位为“0”表示该汉字确实在该页内。如果后一位为“1”,则表示该汉字并不在该页中,此时数点后两位则代表按笔画数该汉字应该排在该页的第几个。第一节汉字键盘输入二、拼音类的输入法?拼音类的输入法的使用用户众多,其突出的优点是易学,从Windo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。