计算机中字符的编码

计算机中字符的编码

ID:34497610

大小:30.16 KB

页数:3页

时间:2019-03-07

计算机中字符的编码_第1页
计算机中字符的编码_第2页
计算机中字符的编码_第3页
资源描述:

《计算机中字符的编码》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、计算机中字符的编码  一个二进制数位简称为位(英文名称为bit)。计算机中最直接、最基本的操作就是对二进制位的操作。  一个二进制位可表示两种状态(0或1)。  两个二进制位可表示四种状态(00,01,10,11)。  位数多,所表示的状态就越多。ASCII码  ASCII码是美国信息交换用标准代码(AmericanStandardCodeforInformationInterchange)。ASCII码虽然是美国国家标准,但它已被国际标准化组织(ISO)认定为国际标准,为世界公认,并在世界范围

2、内通用。  ASCII码用一个8位二进制数(字节)表示,每个字节只占用了7位,最高位恒为0。7位ASCII码可以表示128(27=128)种字符,其中通用控制字符34个,阿拉伯数字10个,大、小写英文字母52个,各种标点符号和运算符号32个。编码范围二进制十进制十六进制基本ASCII码00000000~011111110~1270~7F控制字符00000000~00100000、011111110~32、1270~1F、7F数字00110000~0011100148~5730~39大写字母010

3、00001~0101101065~9041~5A小写字母01100001~0111101097~12261~7A  当最高位为0时,称为基本ASCII码,当最高位为1时,形成扩充的ASCII码,它表示数的范围为128~255,可表示128种字符。通常各个国家都把扩充的ASCII码作为自己国家语言文字的代码。汉字编码  我国用户在使用计算机进行信息处理时,一般都要用到汉字。由于汉字是象形文字,字的数目很多,常用汉字就有3000~5000个,加上汉字的形状和笔画多少差异极大,因此,不可能用少数几个确

4、定的符号将汉字完全表示出来,或像英文那样将汉字拼写出来。汉字必须有它自己独特的编码。  1.汉字信息交换码(国标码)  《信息交换用汉字编码字符集·基本集》是我国于1980年制定的国家标准GB2312-80,代号为国标码,是国家规定的用于汉字信息处理使用的代码依据。  GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括几种外文字母、数字和符号)的代码。  6763个汉字又按其使用频度、组词能力以及用途大小分成一级常用汉字3755个和二级常用汉字3008个。  一级

5、汉字按拼音字母顺序排列;若遇同音字,则按起笔的笔形顺序排列;若起笔相同,则按第二笔的笔形顺序排列,依次类推。所谓笔形顺序,就是横、竖、撇、点和折的顺序。二级汉字按部首顺序排列。  在此标准中,每个汉字(图形符号)采用双字节表示。每个字节只用低7位,最高位恒为1。由于低7位中有34种状态是用于控制字符,因此,只有94(128-34=94)种状态可用于汉字编码。这样,双字节的低7位只能表示94×94=8836种状态。编码范围二进制数码十进制数码基本ASCII码00000000~011111110~1

6、27控制字符00000000~00100000、011111110~32、127可用汉字段00100001~0111111033~126(1~94)扩充ASCII码10000000~11111111128~255控制字符10000000~10100000、11111111128~160、255GB2312-8010100001~11111110161~254(1~94)  此标准的汉字编码表有94行、94列,其行号称为区号,列号称为位号。双字节中,用高字节表示区号,低字节表示位号。非汉字图形符号

7、置于第1~11区,一级汉字3755个且于第16~55区,二级汉字3008个置于第56~87区。  每个图形字符的汉字交换码,均用两个字节的低7位二进制码表示。汉字国标码通常用十六进制数表示。  例如:“中”字的区号为54,位号为48,计算它的二进制数和十六进制数国标码。    解:先将区、位号分别加上32:      54+32=86      48+32=80    分别转换为二进制数:      (86)10=01010110      (80)10=01010000  得到二进制数国标码为

8、:      0101011001010000。  最后通过8421──二进制取位法转换成十六进制汉字国标码为:5650。  又如“国”字的区号为25,位号为90,用以上相同的方法得到它的国标码为:  二进制:0011100101111010  十六进制:397A  2.汉字的机内码  汉字的机内码是供计算机系统内部进行存储、加工处理、传输统一使用的代码,又称为汉字内部码或汉字内码。目前使用最广泛的一种为两个字节的机内码,俗称变形的国标码。这种格式的机内码是将国标GB2312-80交换码的两个字

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。