汉字编码系统.pdf

汉字编码系统.pdf

ID:51500353

大小:1.08 MB

页数:4页

时间:2020-03-25

汉字编码系统.pdf_第1页
汉字编码系统.pdf_第2页
汉字编码系统.pdf_第3页
汉字编码系统.pdf_第4页
资源描述:

《汉字编码系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1、汉字编码系统主要是解决在汉字处理过程中的各个环节中汉字的编码问题。汉字编码常指汉字的国家标准信息码、汉字机内码、输入编码和字型编码。(1)汉字交换码①概念:汉字交换码是计算机与其他系统或设备间交换汉字信息的标准编码。②1981年5月,《信息交换用汉字编码字符集·基本集》(代号GB2312-80),该字符集共收录了6763个汉字和682个图形符号。6763个汉字按其使用频率和用途,又可分为一级常用汉字3755个,二级次常用汉字3008个。其中一级汉字按拼音字母顺序排列,二级汉字按偏旁部首排列。采用

2、两个字节对每个汉字进行编码,每个字节各取七位,这样可对128×128=16384个字符进行编码。③区位码:国家标准码先把汉字排列在一个94行×94行的方阵(二维表格)中,在此正方形矩阵中,每一行称为“区”,每一列称为“位”,这样组成了一个共有94区,每个区有94位的字符集。由这个字符集矩阵表,引出了表示汉字的两种编码,一种称这区位码,另一种被称为国标码。这两种编码都是由两个字节组成,高字节表示“区”的代码,低字节表示“位”的代码。区位码是用十进制数表示一个汉字或图形符号在字符集中的位置。二维表中,每

3、一行称为一个区,用汉字编码的第一个字节表示,称为区码。每个汉字在一行中的位置用第二个字节表示,称为位码。国标码通常用十六进制表示。(2)汉字输入码概念:也称外码,是为了将汉字输入计算机而编制的代码,它是代表某一汉字的一级键盘符号。种类:流水码:根据汉字的排列顺序形成汉字编码,如区位码、国标码、电报码等。音码:根据汉字的“音”形成汉字编码,如全拼码、双拼码、简拼码等。形码:根据汉字的“形”形成汉字编码,如王码五笔、郑码、大众码等。音形码:根据汉字的“音”和“形”形成汉字编码,如表形码、钱码、智能ABC

4、等。不论是哪一种汉字输入方法,利用输入码将汉字输入计算机后,必须将其转换为汉字机内码才能进行相应的存储和处理。(3)汉字机内码概念:汉字机内码(内码)是计算机系统中用来存储和处理中、西方信息的代码。西文内码采用单字节的ASCLL码,而汉字内码则是将区位码两个字节的最高位分别置为“1”,从而形成两个字节表示的汉字机内码。为了最终显示和打印汉字,还要由汉字的机内码来换取汉字的字形码。实际上,每一个汉字的机内码也就是指向该汉字字形码的地址。(4)汉字输出码输出码概念:汉字输出码又称汉字字形码或汉字字模,它

5、是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。点阵字型编码是一种最常见的字型编码,它用一位二进制码对应屏幕上的一个像素点,字形笔划所经过处的亮点用1表示,没有笔划的暗点用0表示。例如,一个1616的点阵汉字的情形如下所示:汉字字库的概念:在计算机中输出汉字时必须要得到相应汉字的字形码,通常用点阵信息表示汉字的字形。所有汉字字形点阵信息的集合就称为汉字字库。显示字库一般为16×16点阵字库,每个汉字的字形码占用32个字节的存储空间,打印字库一般为24×24点阵,每个汉字的字形码

6、占用72个字节的存储空间。常见的字库:由于输出的需要,人们设计了不同字体的字形,相应也有不同的字库。有宋体字库、楷体字库、隶书字库等。2、汉字的输入(1)汉字输入方法概述目前常用的汉字输入方式有:键盘输入方式、语音输入方式、手写输入方式以及扫描识别方式等。语音输入方式:是指人们对着话筒讲话,计算机自动在屏幕上显示出对应的语句。手写输入方式:是借助于计算机连续的笔触感应板和智能应用软件,将手写的汉字输入计算机。扫描识别方式:是通过扫描设备将书面资料输入计算机,它是将图文资料成批快速输入计算机的最佳手段

7、。(2)汉字输入的基本操作各种汉字输入法:Windows98操作系统为用户提供了多种键盘输入方式,它们分别是微软拼音输入法、智能ABC输入法、全拼输入法、五笔输入法和区位输入法等。汉字输入法之间的切换:Ctrl+Shift键,系统将在各种输入法之间循环切换。中英文输入的切换:Ctrl+Space键可实现中英文输入的快速切换。全角和半角输入状态切换:Shift+Space键实现全角和半角输入的状态切换。全角字符和半角字符:所谓半角字符是指在存储和输出时占用一个标准字符位(即一个字节)的字符。ASCLL

8、码表中的英文字母及符号都是半角字符。全角字符中存储和输出时要占用两个标准字符位,所有汉字和汉字国标码表中的符号都是全角字符。为了适应计算机处理汉字信息的需要,1981年我国颁布了GB2312国家标准。该标准选出6763个常用汉字(其中,一级常用汉字3755个,二级汉字3008个)和682个非汉字字符,并为每个字符规定了标准代码,以便在不同的计算机系统之间进行汉字文本交换。GB2312字符集构成一个94行、94列的二维表,行号称为区号,列号称为位号,每一个汉字或符号在码

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。