欢迎来到天天文库
浏览记录
ID:27272232
大小:788.00 KB
页数:56页
时间:2018-11-30
《《数字媒体及应》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第5章数字媒体及应用本章要点:文本与文本处理图像与图形数字声音及应用数字视频及应用5.1文本与文本处理文本:基于特定字符集的、按一定格式组织起来的、具有上下文相关性的一个字符流,每个字符均使用编码表示。文本展现(阅读器)文本处理(文本处理软件)文本生成电子文本文本编辑(编辑器)格式化的电子文本文本存储与传输6/30/20212NJNU1、西文字符的编码西文字符集(拉丁字母、数字、标点等组成)标准ASCII字符集ASCII字符集采用7位编码每个ASCII字符以一个字节存放扩充ASCII字符集:标准ASCII码+扩展ASC
2、II码一、字符的编码6/30/20213NJNU2.汉字的编码汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素。汉字的特点:数量大(我国汉字自古至今累计已超过6万字多个国家和地区使用:港台地区,日、韩、朝、新、马等字形复杂,同音字多,异体字多。我国汉字编码的国家标准:GB2312(6763个常用简体汉字和682个非汉字字符)GBK(20902个CJK汉字和······符号)UCS/Unicode与GB180306/30/20214NJNU(1)GB2312–1980汉字编码包括6763个汉字和
3、682个非汉字字符GB2312构成:一级常用汉字3755个,按汉语拼音排列二级常用汉字3008个,按偏旁部首排列非汉字字符682个GB2312构成一个二维平面,分成94行和94列,行号称为区号,列号称为位号,两者组合就是汉字编码。称为区位码。区位码的区号和位号分别加上20H,得到国标码。国标码的两个字节的最高位置1,得到PC机常用的机内码6/30/20215NJNU以汉字“啊”为例:区位码为:1601,表示区号16位号01对应二进制数为:00010000,00000001国标码对应二进制数为:00110000,00
4、100001B机内码对应二进制数为:10110000,10100001B6/30/20216NJNU(2)GBK汉字内码扩充规范总计23940个码位,共收入21003个汉字和883图形符号简体和繁体汉字在同一个字符集中;包含了中、日、韩认同的全部CJK汉字;与GB2312-80保持向下兼容;6/30/20217NJNU3、UCS/Unicode与GB18030汉字编码标准(1)通用编码字符集UCS/UnicodeUCS实现了对所有字符统一编码(2)GB18030编码(2000年)目的是向UCS过渡,同时与GB2312、
5、GBK兼容,目前已经在许多计算机系统中使用。用1、2或4字节编码,汉字数达到27000多个6/30/20218NJNU二、文本的准备文本信息的输入:6/30/20219NJNU汉字键盘输入汉字的键盘输入编码输入编码要求:易学、易记、效率高、重码少、容量大输入编码分类:数字编码字音编码字形编码形音编码用不同的输入编码方法输入同一个汉字,其内码是一样的6/30/202110NJNU联机手写汉字识别原理:用专用笔在专用书写板上书写汉字(或符号)计算机实时自动识别用该汉字(或符号)对应的代码进行保存例:“汉王”手写笔正识
6、率达到90%以上,识别速度超过12字/秒6/30/202111NJNU汉语语音识别分类:孤立语音/连续语音识别小词汇量/大词汇量语音识别特定人/非特定人语音识别现状:特定人连续语音识别率已达到90%以上目标:非特定人大词汇量的连续语音识别6/30/202112NJNU4.印刷体汉字识别输入对于将现存的大量书、报、刊物、档案、资料等输入计算机是非常重要的手段。5.脱机手写汉字识别输入是一种用于将预先手写好的文稿输入计算机的方法,也是计算机字符识别中最困难的一个问题。6/30/202113NJNU1、简单文本(纯文本)除了
7、表达正文的字符和几个打印控制字符外,不含其它格式信息和结构信息。简单文本又称为纯文本,ASCII文本,其文件的后缀为“.txt”(文本文件)简单文本为一种线性结构,由若干行构成,每行由若干个字构成2、丰富格式文本在简单文本中增加格式控制和结构说明信息,构成丰富格式文本RTF是一种中间格式,它的目的是使各种丰富格式文本相互交换使用,以兼容不同格式文本。三、文本的类型6/30/202114NJNU3、超文本超文本采用一种网状结构来组织信息一个超文本由若干个文本块组成,这些文本块称为节点节点可以是文字、图形、图像、声音或视频
8、基于多媒体信息结点的超文本,也称为超媒体。例:Windows中的“帮助”文件就是一种典型的超文本文本的类型6/30/202115NJNU超文本结构a1a2b2c2f1d1c1b1e1g1h1a36/30/202116NJNU四、文本的编辑与处理1、文本编辑与文本处理文本编辑:内容:对字(词,句)、段落、页面等进行添加、删除、修改
此文档下载收益归作者所有