2011冲剌班计算机复习要点(第五讲).doc

2011冲剌班计算机复习要点(第五讲).doc

ID:50822775

大小:52.00 KB

页数:17页

时间:2020-03-15

2011冲剌班计算机复习要点(第五讲).doc_第1页
2011冲剌班计算机复习要点(第五讲).doc_第2页
2011冲剌班计算机复习要点(第五讲).doc_第3页
2011冲剌班计算机复习要点(第五讲).doc_第4页
2011冲剌班计算机复习要点(第五讲).doc_第5页
资源描述:

《2011冲剌班计算机复习要点(第五讲).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、2011冲剌班计算机复习要点(第五讲)多媒体一、文本及文本处理文本准备(即:文本输入)、文本编辑、文本处理、文本传输、文本展现(即:文本输出)。二、字符编码1、ASCII码以下数据要记住:96个可打印字符。32个不可打印字符。字符‘A’的ASCII码值是:65字符‘a’的ASCII码值是:97数字‘0’字符ASCII码值是:48一个标准ASCII字符需要7位二进制位表示。在内存中存储时要占用一个字节,即8位,但只用到7位,最高位总是0。2、汉字编码①GB2312-80一共分94区、94位。一级常用汉字有3755个,按汉语拼音排序。二级常用汉字有3008个,按偏旁部首排序。没有繁体字。与

2、ASCII码不兼容(因为:ASCII是最高位为0,而一个汉字是2个字节,它们的最高位都是1)汉字区位码:汉字‘啊’在16区1位上,故:汉字‘啊’的区位码是:1601(两个字节)。区位码是汉字输入码。汉字国标码:由区位码中的区+32、位+32得到。如:汉字‘啊’的区位码是:16(区)01(位),则国标码是:4833(两个字节)。国标码用于不同系统间交流用。汉字机内码:是汉字输入到电脑后的编码。在计算机内部处理汉字时,都是使用机内码进行的。国标码每一个字节加上128(即:每一个字节高位置1),就是机内码。如:汉字‘啊’的区位码是:16(区)01(位),则国标码是:4833(两个字节)。则相

3、应机内码是:48+128=17633+128=161,因此汉字‘啊’的机内码是:176161(两个字节且高位都是1)归纳:区位码=è机内码:区+160位+160区位码=è国标码:区+32位+32国标码=è区位码:字节-32字节-32机内码=è区位码:字节-160字节-160国标码=è机内码:字节+128字节+128(等价于高位置1)机内码=è国标码:字节-128字节-128测试:若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设有一段文字的内码为CBF5D0B45043CAC7D6B8,则在这段文字中,含有多少个汉字和多少个西文字符思路:因为:一个汉字是两

4、个字节且高位都是1.因此:CBF5(这两个字节CBF5高位都是1,因而是一个汉字)D0B4(这两个字节D0B4高位都是1,因而是一个汉字)50(一个英文字符)43(一个英文字符)CAC7(一个汉字)D6B8(一个汉字)。结果:4个汉字,2个英文字符。②GBK:在GB2312基础上扩充了大量汉字。包括大量繁体。因此:GBK向下兼容GB2312,保持:一个汉字2个字节,且高位都是1。与ASCII码仍不兼容。③GB18030:对UNICODE中的10万个字符重新按我国情况进行编码。向下兼容GBK(自然也就兼容GB2312了)。是不等长编码。即:一个字符或能是1个字节,也或能是2个字节或4个字

5、节。向下兼容ASCII(因为是不等长编码)。与UNICODE不兼容。④台湾繁体BIG5:与所有的GBXXX标准都不兼容。⑤UNICODE中的UTF-8编码(与GB18030编码的字符集是一样的,即:字符相同,但编码的方式不同):UTF-8编码也是不等长编码。与GB系列编码都不兼容,但与ASCII码兼容。测试:P38三、文本准备输入汉字的方式有许多种。手工和自动。汉字键盘输入编码:数字编码、字音编码、字形编码和形音编码,汉字的输入编码与汉字的机内码是不同的概念,同一个汉字可以有多种输入编码,但机内码都是相同的。汉字OCR输入:将印刷或打印在纸上的中西文字输入计算机并经过识别转换为编码表示

6、的一种技术,这种输入方式适合需要处理大批量文字资料的文档管理、图书情报等应用。汉字的输出过程:先根据字符的字体选择相应的字型库,再按照该字符的机内码从字型库中取出该字符的形状描述信息,然后按形状描述信息生成字形,再按照其有关属性作必要的变换。字符的字型描述方法:点阵描述和轮廓描述。点阵描述是用一组矩形阵列的点表示一个字符;轮廓描述是用一组直线和曲线来勾画字符的轮廓,这种方式精度高,字的大小变化时能保持字形不变。Windows中TrueType字库采用的是轮廓描述方法。点阵字形占用字库量大,但使用简单;轮廓字形占用字库量较小,但在输出之前要通过复杂的处理转换为点阵形式。点阵描述空间计算:

7、一个16*16点阵汉字的字型描述,需要多少字节空间?16*16/8=32B若是一个汉字字型是:24*24,则是24*24/8=72B。归纳:若是一个汉字字型是n*n,则是:n*n/8B字型码(就是汉字的字型描述):用当汉字输出(如:显示、打印)时,才需要使用。用于生成汉字的图案。测试:P39四、文本分类1)简单文本即纯文本。只包含文本本身。几乎没有格式信息(如:字体、字型、字号等)扩展名是:.txt。用记事本程序可制作。2)富格式文本文本中除了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。