欢迎来到天天文库
浏览记录
ID:28683998
大小:59.75 KB
页数:9页
时间:2018-12-12
《2014冲剌班计.算机复习要点(第.五讲)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2014冲剌班计算机复习要点(第五讲)多媒体一、文本及文本处理文本准备(即:文本输入)、文本编辑、文本处理、文本传输、文本展现(即:文本输出)。组成文本的基本元素是____字符____。常用字符的集合称为______字符集_____。二、字符编码1、ASCII码美国标准信息交换码是________ASCII码/___________。以下数据要记住:基本ASCII字符集中数据:96个可打印字符。32个控制字符。共128个。字符‘A’的ASCII码值是:65字符‘a’的ASCII码值是:97数字‘0’字符ASCII码值是:48目的:
2、用于计算题。如:’A’是65,求’d’ASCII码值空格字符ASCII码值是:32一个标准ASCII字符需要7位二进制位表示。在内存中存储时要占用一个字节,即8位,但只用到7位,最高位总是0。2、汉字编码①GB2312-80一共分94区、94位。第一部分:字母、数字和各种符号共682个。称为GB2312图形符号。如:汉字的标点符号、全角方式下的英文字符如’A’。都是两个字节,而且高位都是1。第二部分:一级常用汉字(共3755个),按汉语拼音排列第三部分:二级常用汉字(共3008个),按偏旁部首排列汉字一共有:3755+3008=6
3、763个。没有繁体字。与ASCII码不兼容(因为:ASCII是最高位为0,而一个汉字是2个字节,它们的最高位都是1)汉字区位码:汉字‘啊’在16区1位上,故:汉字‘啊’的区位码是:1601(两个字节)。区位码是汉字输入码。汉字国标码:由区位码中的区+32、位+32得到。如:汉字‘啊’的区位码是:16(区)01(位),则国标码是:4833(两个字节)。国标码用于不同系统间交流用。汉字机内码:是汉字输入到电脑后的编码。在计算机内部处理汉字时,都是使用机内码进行的。(汉字在内存中、存储在硬盘等外存中都是使用的机内码)国标码每一个字节加上
4、128(即:每一个字节高位置1),就是机内码。如:汉字‘啊’的区位码是:16(区)01(位),则国标码是:4833(两个字节)。则相应机内码是:48+128=17633+128=161,因此汉字‘啊’的机内码是:176161(两个字节且高位都是1)归纳:区位码=è机内码:区+160位+160区位码=è国标码:区+32位+32国标码=è区位码:字节-32字节-32第9页共9页机内码=è区位码:字节-160字节-160国标码=è机内码:字节+128字节+128(等价于高位置1)机内码=è国标码:字节-128字节-128注意:若是用十六
5、进制计算,A0就是十进制的160.测试:若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设有一段文字的内码为CBF5D0B45043CAC7D6B8,则在这段文字中,含有多少个汉字和多少个西文字符思路:因为:一个汉字是两个字节且高位都是1.因此:CBF5(这两个字节CBF5高位都是1,因而是一个汉字)D0B4(这两个字节D0B4高位都是1,因而是一个汉字)50(一个英文字符)43(一个英文字符)CAC7(一个汉字)D6B8(一个汉字)。结果:4个汉字,2个英文字符。②GBK:在GB2312基础上扩充了
6、大量汉字。包括大量繁体。大约2万1千多个汉字。因此:GBK向下兼容GB2312,l与GB2312相同的字符,其编码保持相同。(一个汉字2个字节,且高位都是1)l新扩充的符号与汉字,则也是2个字节,第1个字节高位必须是1,第2个字节的高位可以是0也可以是1。与ASCII码仍不兼容。③GB18030:对UNICODE中的10万个字符重新按我国情况进行编码。向下兼容GBK(自然也就兼容GB2312了)。是不等长编码。即:单字节编码表示ASCII字符,双字节编码表示汉字(向下兼容GBK),大约2万3千多个汉字,四字节编码表示其它字符。向下
7、兼容ASCII(因为是不等长编码)。与UNICODE不兼容。④台湾繁体BIG5:与所有的GBXXX标准都不兼容。⑤UNICODE中的UTF-8编码(与GB18030编码的字符集是一样的,即:字符相同,但编码的方式不同):UTF-8编码也是不等长编码。与GB系列编码都不兼容,但与ASCII码兼容。⑥ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码,称为__UCS标准___对应的工业标准称为____Unicode____,它的实现有____UTF-8_______和____UTF-16____⑦UTF-8:单字节可变长编码
8、。标准ASCII字符是一个字节。我国汉字是3个字节。UTF-8与ASCII向下兼容。与我国所有的GB系列汉字编码标准均不兼容。⑧Unicode编码文本的交换标准是______UTF-8__________。在LINUX系统中广泛使用(即LINUX下
此文档下载收益归作者所有