《数字媒体及应用》PPT课件

《数字媒体及应用》PPT课件

ID:38898718

大小:519.50 KB

页数:41页

时间:2019-06-21

《数字媒体及应用》PPT课件_第1页
《数字媒体及应用》PPT课件_第2页
《数字媒体及应用》PPT课件_第3页
《数字媒体及应用》PPT课件_第4页
《数字媒体及应用》PPT课件_第5页
资源描述:

《《数字媒体及应用》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章数字媒体及应用学习目标和要求掌握ASCII字符的编码的规则和特点掌握中文信息存储的特点,GB2312国标字符集的构成、区位码、机内码和国标码及其关系了解BIG5、GBK、GB18030、Unicode等编码了解文本在计算机中的处理过程及相关原理了解图像(image)、图形(graphics)的概念和特点,熟悉图像信息在计算机内的表示和处理了解声音、视频信息的表示和应用一、字符编码1、西文字符的编码西文信息是由字母、数字、标点符号及一些特殊符号组成的,它们的集合统称为西文字符集。ASCII字符集和ASCII码标准ASCII(ISO0646):7位编码

2、,从0000000到1111111,共128种编码,可用来表示128个不同的字符。95个可打印字符(常用字母、数字、标点符号等)33个控制字符用一个字节存放一个字符的ASCII码,高位为0。5.1文本与文本处理ASCII码的排放顺序:1.数字、字母均按自然顺序排列。2.大小写字母的比较,小写字母大于大写字母。(A+32=a65+32=97)3.字母与数字比较,数字(0-9)的代码均小于字母(A-Z)的代码4.空格比数字,标点,字母等常见符号都小。扩展ASCII码(ISO2022)八位二进制表示一个字符,共有256个字符,前128个等同于标准ASCII,后

3、128个均为高位为1的编码形式。2、汉字字符的编码GB2312汉字编码GBK汉字内码扩展规范GB18030编码BIG5编码UCS/Unicode编码国家标准局1981年《信息交换用汉字编码字符集—基本集》(1)GB2312汉字编码6763个常用汉字和682个非汉字字符7445组成:第一部分:字母、数字和各种符号共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉语拼音排列第三部分:二级常用字,共3008个,按偏旁部首排列①汉字区位码:汉字在代码表中的行号、列号这是一个二维代码表,有94行、94列,汉字在代码表中的位置用它所处

4、的行号、列号表示:行号区号列号位号采用双字节编码。例如:“大”字的区号20,位号83,区位码是2083用2个字节表示为:0001010001010011②国标码:问题:信息通信中,汉字的区位码与通信使用的控制码(00H~1FH)发生冲突。解决方案:为了避免冲突,每个汉字的区号和位号必须分别加上32得到的代码称为汉字的“国标交换码”,用于汉字的传输和交换。例如:“大”字的区号20,位号83区位码2083二进制表示为:0001010001010011国标交换码52115二进制表示为0011010001110011③机内码:问题:文本中的汉字与西文字符经常是混

5、合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。解决方法:使表示GB2312汉字国标码的两个字节最高位都置为“1”。这种汉字编码,称为GB2312汉字的“机内码”,存储在计算机中。例如:“大”字区位码2083国标交换码52115二进制表示为0011010001110011机内码180243二进制表示为1011010011110011(B4F3H)(1)Q1+32=G1Q2+32=G2(区位码国标码)总结:区位码,国标码,机内码之间的转换假设某个汉字国标码G1G2(G1表示第一个字节,G2表示第二个字节),区位码Q1Q

6、2,机内码J1J2,则:(2)G1+128=J1G2+128=J2(国标码机内码)1995年颁布,全称《汉字内码扩展规范》总计23940个码位,共收入21003个汉字和883图形符号特点:双字节编码简体和繁体汉字在同一个字符集中Windows中文版操作系统、Office简体中文版都提供GBK汉字的支持。(2)GBK汉字内码扩充规范(GBK-95)目的:建立统一的多文本处理环境,实现所有字符在同一字符集中统一编码优点:编码空间极大,能容纳足够多的各种字符集(13亿字符)缺点:4字节的字符编码使存储空间浪费严重实际做法:UCS-2为其子集,采用双字节编码,共

7、有字符49194个(3)UCS/Unicode(《通用多8位编码字符集》)编码使用范围:通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”。收录内容:13461个汉字和符号符号408个常用汉字5401个次常用汉字7652个(4)BIG5编码目的:与GB2312和GBK兼容,向UCS/Unicode过渡。内容:规定了信息交换用的基本图形、字符及其二进制编码的十六进制表示,同时收录了主要的少数民族文字。编码方式:在GB2312和GBK的基础上进行了扩充,采用单字节/双字节/四字节三种方式编码,码位数160多万。(5)GB18030汉字编码标准二、文本处

8、理1、文本:文本是基于特定字符集的、具有上下文相关性的一个字符流,每个字符都使用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。