欢迎来到天天文库
浏览记录
ID:48033915
大小:1.78 MB
页数:11页
时间:2020-01-11
《大学计算机基础字符的编码——区位码和国标码.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、字符的编码计算机是以二进制的形式存储和处理数据的,因此字符也必须按特定的规则进行二进制编码才能进入计算机。字符编码的方法:确定需要编码的字符总数;将每一个字符按顺序确定序号,序号的大小无意义,仅作为识别与使用这些字符的依据。字符形式的多少涉及编码的位数。一.西文字符的编码字符编码——表示字符的二进制编码,常用的有ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准码)。国际通用的是7位ASCII码,用7位二进制数表示一个字符的编码,共有27=128个不同的编码值,相应可以表示128个不同字符的编码。二.汉字的编码常用汉字
2、6763个,分成两级:一级汉字有3755个,按汉语拼音字母的次序排列;二级汉字有3008个,按偏旁部首排列。一个国标码用两个字节来表示一个汉字,每个字节的最高位为0。为避开ASCII码表中的控制码,将GB2312―80中的6763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。区位码——由区号(行号)和位号(列号)构成。区位码最多可以表示9494=8836个汉字。区位码由4位十进制数字组成,前两位为区号,后两位为位号。在区位码中,01~09区为特殊字符,10~55区为一级汉字,56~87区为二级汉字。例如汉字“中”的区位码为5448,即它位于第54行、第48列。区位码
3、是一个4位十进制数,国标码是一个4位十六进制数。汉字输入区位码与国标码之间转换方法:将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32),就成为汉字的国标码。例如,汉字“中”字的区位码与国标码及转换如下:区位码5448D(3630)H国标码8680D(3630H+2020H)=5650H二进制表示为:(0011011000110000)B+(0010000000100000)B=(0101011001010000)B三.汉字的处理过程从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。这些编码主要包括:汉字输入码、汉字内
4、码、汉字地址码、汉字字形码等。汉字信息处理系统的模型1)汉字输入码2)汉字内码对应于国标码,一个汉字的内码用2个字节存储,并把每个字节的最高二进制位置“1”作为汉字内码的标识,如果用十六进制来表述,就是把汉字国标码的每个字节上加一个(80)H(即二进制数10000000)。所以,汉字的国标码与其内码存在下列关系:汉字的内码=汉字的国标码+(8080)H例如,在前面已知“中”字的国标码为(5650)H,则根据上述关系式得:“中”字的内码=“中”字的国标码(5650)H+(8080)H=(D6D0)H二进制表示为:(0101011001010000)B+(1000000010000000)B
5、=(1101011011010000)B3)汉字内码汉字地址码汉字地址码是指汉字库(这里主要指整字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。需要向输出设备输出汉字时,必须通过地址码对汉字库进行访问。汉字库中,字形信息都是按一定顺序(大多数按标准汉字交换码中汉字的排列顺序)连续存放在存储介质中,所以汉字地址码也大多是连续有序的,而且与汉字内码间有着简单的对应关系,以简化汉字内码到汉字地址码的转换。4)汉字字形码汉字字形码又称汉字字模,用于汉字在显示屏或打印机输出。汉字字形码通常有两种表示方式:点阵和矢量表示方式。汉字字形点阵机器编码
此文档下载收益归作者所有