汉字是如何编码的.ppt

汉字是如何编码的.ppt

ID:50752879

大小:2.45 MB

页数:8页

时间:2020-03-13

汉字是如何编码的.ppt_第1页
汉字是如何编码的.ppt_第2页
汉字是如何编码的.ppt_第3页
汉字是如何编码的.ppt_第4页
汉字是如何编码的.ppt_第5页
资源描述:

《汉字是如何编码的.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、汉字是如何编码的以奇渠存储和单位011000018个位组成一个字节(Byte,缩写位B)字节是存储信息的基本单位1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB存储一个汉字需要两个字节。由于汉字有一万多个,常用的也有六千多个,所以编码采用两字节的低7位共14个二进制位来表示。一般汉字的编码方案要解决4种编码问题。位(bit)存储信息的最小单位汉字的编码——汉字交换码汉字交换码主要是用作汉字信息交换的。以国家标准局1980年颁布的《信息交换用汉字编码字符集基本集》(代号GB2312-80)规定汉字交换码作为国家标

2、准汉字编码,简称国标码。国标GB2312-80规定,所有的国际汉字和符号组成一个94*94的矩阵。在该矩阵中,每一行称为一个“区”,每一列称为一个“位”,这样就形成了94个区号(01~94)和94个位号(01~94)的汉字字符集。国标码中有6763个汉字和628个其他基本图形字符,共计7445个字符。其中规定一级汉字3755个,二级汉字3008个,图形符号682个。一个汉字所在的区号与位号简单地组合在一起就构成了该汉字的“区位码”。在汉字区位码中,高两位为区号,低两位为位号。因此,区位码与汉字或图形符号之间是一一对应的。一个汉字由两个字节代码表示。国标码

3、=2020H+区位码例:“学”的区位码为4907D国标码=3107H+2020H=5127H区位码表01-09区为特殊符号。10-15区未有编码。16-55区为一级汉字,按拼音排序。56-87区为二级汉字,按部首/笔画排序。88-94区则未有编码。汉字编码——汉字机内码汉字机内码:计算机系统内部标识汉字的编码。一个汉字由两个字节组成,为了与ASCII码区别,最高位均为1。机内码=区位码+A0A0H机内码=国标码+8080H例:“学”字的区位码为:3107H国标码为:5127H机内码=3107H+A0A0H=D1A7H=5127H+8080H=D1A7H8

4、080H=1000000010000000汉字编码——汉字输入码输入码(各种输入码是不同的)键盘处理交换码国标码高位改1机内码如输入“学”;拼音输xue国标码:双字节,高位为0得到“学”的国标码:0101000100100111得到学的机内码:1101000110100111汉字编码——汉字字形码汉字在显示和打印输出时,是以汉字字形信息表示的,即以点阵的方式形成汉字图形。汉字字形码是指确定一个汉字字形点阵的代码(汉字字形码)。一般采用点阵字形表示字符。目前普遍使用的汉字字型码是用点阵方式表示的,称为“点阵字模码”。所谓“点阵字模码”,就是将汉字像图像一样

5、置于网状方格上,每格是存储器中的一个位,16×16点阵是在纵向16点、横向16点的网状方格上写一个汉字,有笔画的格对应1,无笔画的格对应0。这种用点阵形式存储的汉字字型信息的集合称为汉字字模库,简称汉字字库。通常汉字显示使用16×16点阵,而汉字打印可选用24×24点阵、32×32点阵、64×64点阵等。汉字字形点阵中的每个点对应一个二进制位,1字节又等于8个二进制位,所以16×16点阵字形的字要使用32个字节(16×16÷8字节=32字节)存储,64×64点阵的字形要使用512个字节。在16×16点阵字库中的每一个汉字以32个字节存放,存储一、二级汉字

6、及符号共8836个,需要282.5KB磁盘空间。而用户的文档假定有10万个汉字,却只需要200KB的磁盘空间,这是因为用户文档中存储的只是每个汉字(符号)在汉字库中的地址(内码)谢谢观看!窗棂趣分享

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。