欢迎来到天天文库
浏览记录
ID:45440605
大小:763.50 KB
页数:79页
时间:2019-11-13
《《文字信息处理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第五章 图像数字化原理引 言第一节 图像的数字化第二节 数字图像数据与其像素、色彩的关系第三节 图像分辨率第四节 图像存储格式第五节 文字信息处理第五节 文字信息处理第五章 图像数字化原理文字信息处理(文字排版):依据文字原稿及对印刷品的要求,确定适当的字体、字号、行距、字距、版式等,并利用文字信息处理系统对文字原稿进行版面设计和排版过程。第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字代码。在汉字信息处理系统中,对于不同部位,存在着多种不同的编码方式,形成汉字代码体系。输入码机内码字形码地址码第五节
2、文字信息处理第五章 图像数字化原理一、汉字代码体系1、汉字输入码汉字输入码是为用户由计算机外部输入汉字而编制的汉字编码,又称为汉字外部码,简称外码。使用较多的有以下4类: (1)顺序码:如区位码、电报码等。 (2)音码:如拼音码、自然码等。 (3)形码:如五笔字型、大众码等。 (4)音形码:如双拼码等。第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系2、汉字机内码汉字机内码是汉字处理系统内部存储、处理汉字而使用的编码,简称内码。汉字机内码由汉字国际标准交换码(国标码)变换而来 汉字交换码是汉字信息处理系统之间或通信系统之间传输信息时,对每个汉字所规定
3、的统一编码。西文字符:7位二进制码,128个字符,用一个字节表示一个西文字符。ASCⅡ码:美国标准信息交换码(AmericanStandardCodeforInformationInterchange)第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系国际标准交换码b7b6b5000001010011100101110111b4b3b2b101234567…00000NULDLESP0@P‵P…00011SOHDC1!1AQAQ…00102STXDC2”2BRBR…00113ETXDC3#3CSCS…01004EOTDC4$4DTDT…01015ENONAK%5EUEU…
4、01106ACKSYN&6FVFV…01117BELETB’7GWGW…10008BSCAN(8HXHX…10019HTEM)9IYIY…1010ALFSUB*:JZJZ…1011BVTESC+;K[K{…1100CFFFS,5、…1101DCRGS-=M}M]…1110ESORS.>N↑N~…1111FSIUS/?O←oDELASCⅡ码表从表中可知:大写英文字母A的代码是41(十六进制)或1000001(二进制);小写英文字母a的代码是61或1100001;分号“;”的代码是3B或0111011;删除(DEL)的代码是7F或1111111;空格(SP,即Space)的代码6、是20或0100000。国际标准交换码西文字符:第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系国际标准交换码中文:(1)国标码:1981年,我国颁布了《中华人民共和国国家标准信息交换用汉字编码字符集(基本集)》(GB2312-80),6763个汉字和682个非汉字字符,共计7445个。到2000年,GB18030-2000,都是在基本集上的扩充。都向上兼容。国际码:区位码的区号和位号各加32。每个汉字的区位码和国标码是唯一的。计算机中,中、西文是混合处理的,为了识别中、西文,把汉字用双字节表示,高位置“1”,成为汉字16位的机内码,西文用单字节表示,高位置“0”,成为7、西文8位的机内码。(2)区位码将GB2312-80全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号从01~94;每一列称为一个“位”,编号也是从01~94。这样,每一个字符便具有一个区码和一个位码,将区码置前,位码置后,组合在一起就成为区位码。国际标准交换码中文:例:汉字“大”,区位码“2083”,二进制码为:00101001010011各加32变为国标码:“52115”,即为:01101001110011高位置“1”,成机内码:1011010011110011第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系2、汉字机内码汉字字形码是表示汉字字形信息的编码8、。第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系3、汉字字形码文字字形技术点阵字形轮廓字形矢量字形曲线字形第五章 图像数字化原理一、汉字代码体系3、汉字字形码第五节 文字信息处理(1)、点阵字形应用于显示、低分辨率打印输出(针式)16×16,24×24,32×32,64×64,48×48,128×128等等。缺点:数据量大,文字放大有锯齿边,变形困难。16×16点阵需多少字节存储一个字形?16×16点阵第五章 图像数字化原理一、汉字代码体系3、汉字字形码第五节 文字信
5、…1101DCRGS-=M}M]…1110ESORS.>N↑N~…1111FSIUS/?O←oDELASCⅡ码表从表中可知:大写英文字母A的代码是41(十六进制)或1000001(二进制);小写英文字母a的代码是61或1100001;分号“;”的代码是3B或0111011;删除(DEL)的代码是7F或1111111;空格(SP,即Space)的代码
6、是20或0100000。国际标准交换码西文字符:第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系国际标准交换码中文:(1)国标码:1981年,我国颁布了《中华人民共和国国家标准信息交换用汉字编码字符集(基本集)》(GB2312-80),6763个汉字和682个非汉字字符,共计7445个。到2000年,GB18030-2000,都是在基本集上的扩充。都向上兼容。国际码:区位码的区号和位号各加32。每个汉字的区位码和国标码是唯一的。计算机中,中、西文是混合处理的,为了识别中、西文,把汉字用双字节表示,高位置“1”,成为汉字16位的机内码,西文用单字节表示,高位置“0”,成为
7、西文8位的机内码。(2)区位码将GB2312-80全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号从01~94;每一列称为一个“位”,编号也是从01~94。这样,每一个字符便具有一个区码和一个位码,将区码置前,位码置后,组合在一起就成为区位码。国际标准交换码中文:例:汉字“大”,区位码“2083”,二进制码为:00101001010011各加32变为国标码:“52115”,即为:01101001110011高位置“1”,成机内码:1011010011110011第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系2、汉字机内码汉字字形码是表示汉字字形信息的编码
8、。第五节 文字信息处理第五章 图像数字化原理一、汉字代码体系3、汉字字形码文字字形技术点阵字形轮廓字形矢量字形曲线字形第五章 图像数字化原理一、汉字代码体系3、汉字字形码第五节 文字信息处理(1)、点阵字形应用于显示、低分辨率打印输出(针式)16×16,24×24,32×32,64×64,48×48,128×128等等。缺点:数据量大,文字放大有锯齿边,变形困难。16×16点阵需多少字节存储一个字形?16×16点阵第五章 图像数字化原理一、汉字代码体系3、汉字字形码第五节 文字信
此文档下载收益归作者所有