计算机专转本辅导第5章数字媒体应用

计算机专转本辅导第5章数字媒体应用

ID:38662185

大小:2.78 MB

页数:91页

时间:2019-06-17

计算机专转本辅导第5章数字媒体应用_第1页
计算机专转本辅导第5章数字媒体应用_第2页
计算机专转本辅导第5章数字媒体应用_第3页
计算机专转本辅导第5章数字媒体应用_第4页
计算机专转本辅导第5章数字媒体应用_第5页
资源描述:

《计算机专转本辅导第5章数字媒体应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用5.1文本与文本处理5.1.1字符的编码5.1.2文本准备5.1.3文本的分类5.1.4文本编辑、排版与处理5.1.5文本的展现文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。文字数值语言音乐图像···信息的形态有多种写作编辑排版印刷发行写作传统的文字处理过程计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文

2、本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)5.1.1.字符在计算机中的表示一、西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编

3、码计算机中使用1个字节存储1个ASCII字符存在问题:字符集太小(只有128个字符)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码0XXXXXXX一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》(我国第一个国家标准)——GB2312-1980GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假

4、名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字和符号都有一个确定位置区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。问题:文本中的汉字与西文字符易与单字节的标准ASCII码混淆不清。例如:“大”字的区号20,位号83,区位码是2083,用2个字节表示为:0001010001010011(1453H)。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。例如:“大”字的内码是:1011010011110011(B4F3)。汉字的区

5、位码、国标码、机内码的关系:国标码=区位码+2020H机内码=国标码+8080H机内码=区位码+A0A0H汉字机内码双字节,最高位是1; 西文字符机内码单字节,最高位是0。GBK汉字内码扩充规范GB2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字与GB8312保持向下兼容,也使用双字节表示,第

6、1字节最高位必须为“1”:1X第1字节第2字节XXXXXXXXXXXXXXUCS/Unicode多文种大字符集背景:为了实现全球数以千计的不同语言文字的统一编码方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112个),称为UCS/UnicodeUCS/Unicode的编码方案:先实现部分字符的编码(共107,361个字符)尽量与已有编码标准兼容其中包含有中、日、韩统一整理出来的近3万汉字(CJK汉字)允许有若干不同的编码方案,例如:GB18030汉字编码标准背景:无论是Unic

7、ode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示UCS/Unicode中

8、的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。