汉字编码 及 gb2312

汉字编码 及 gb2312

ID:1231809

大小:632.50 KB

页数:62页

时间:2017-11-09

汉字编码 及 gb2312_第1页
汉字编码 及 gb2312_第2页
汉字编码 及 gb2312_第3页
汉字编码 及 gb2312_第4页
汉字编码 及 gb2312_第5页
资源描述:

《汉字编码 及 gb2312》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、汉字国标码每个汉字有个二进制编码,叫汉字国标码。在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。每个汉字使用2个字节。GB2312-80GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列

2、;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而GB2312最多能表示6763个汉字。汉字机内码汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中

3、西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。GB码的机内码为二字节长的代码,它是在相应GB码的每个字节最高位上加“1”,即汉字机内码=汉字国标码+8080H例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。汉字机内码的基础是汉字国标码。机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将

4、国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。举例:机内码位BEDF,求区位码?有两种解法:1.BEDFH-A0A0H=1E3FH=77

5、43D;2.BEDFH-8080H=3E5FH(国标码),3E5FH-2020H=1E3FH=7743D.查找说明所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。在此介绍的是《国家标准信息交换汉字编码》。这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。(1)按音序查常用汉字按音序几乎都可查到,例如:“白”字,首先,按其发音bai查在汉字编码表中的位置,然后在bai范围内查“白”字,找到“白”

6、字后,其汉字右侧的数字1655就是“白”的汉字编码。(2)关于多音字的查找由于汉字编码是一种无重码的汉字编码,所以多音字只有一个编码。在查多音字时,如果用某个音查不到,可换另外的音去查。例如:重庆的“重”和重量的“重”,字同音不同,汉字“重”的编码是按Zhong音编码的。(3)生僻字的填涂方法对于姓名汉字或单位不在给定的编码表中的情况的考生,让考生涂写编码0000代替该字。a啊1601阿1602吖6325嗄6436腌7571锕7925ai埃1603挨1604哎1605唉1606哀1607皑1608癌1609蔼1610矮

7、1611艾1612碍1613爱1614隘1615捱6263嗳6440嗌6441嫒7040瑷7208暧7451砹7733锿7945霭8616an鞍1616氨1617安1618俺1619按1620暗1621岸1622胺1623案1624谙5847埯5991揞6278犴6577庵6654桉7281铵7907鹌8038黯8786ang肮1625昂1626盎1627ao凹1628敖1629熬1630翱1631袄1632傲1633奥1634懊1635澳1636坳5974拗6254嗷6427岙6514廒6658遨6959媪7033骜

8、7081獒7365聱8190螯8292鏊8643鳌8701鏖8773ba芭1637捌1638扒1639叭1640吧1641笆1642八1643疤1644巴1645拔1646跋1647靶1648把1649耙1650坝1651霸1652罢1653爸1654茇6056菝6135岜6517灞6917钯7857粑8446鲅8649魃8741

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。