《文字属性》PPT课件

《文字属性》PPT课件

ID:39537438

大小:1.20 MB

页数:67页

时间:2019-07-05

《文字属性》PPT课件_第1页
《文字属性》PPT课件_第2页
《文字属性》PPT课件_第3页
《文字属性》PPT课件_第4页
《文字属性》PPT课件_第5页
资源描述:

《《文字属性》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章文字1.文字属性在排版术语中,文字被称为字模。字模是一个传统概念。原指铸造的铅活字模型,现指印刷用字。字模(文字)有三个属性:字体、字号、心身比。字体:文字的书写样式字号:字模边框的高度心身比:字心与字身的面积比过去铅字的心身比为98%,照相文字心身比为92.5%。方正书版和发排系统允许选择不同的心身比。在其它条件相同的情况下,采用不同的心身比得到不同的版面效果。字模中线字身字心边框法线基线基线:在排版时,同一行中的文字相对齐的线称为基线,横排时基线为文字的下边,竖排时基线为文字的左边线。法线:通过上下边线中点的竖直线称为法线。法线方向

2、向上。中线:通过左右边线中点的水平线称为中线。排成一行的文字也可以以中线或以法线相对齐。字模中线字身字心边框法线基线1.1汉字属性汉字信息处理技术是汉字文字处理技术的基础,它体现在对汉字属性的处理过程中。汉字的属性包括汉字的字量、字频、字形、字音、字义等,对这些属性的信息化处理贯穿在汉字信息处理流程的各个阶段以及相关的技术考虑中。1.汉字的字量     在中文电脑中,选用或配备多少个汉字由所用的汉字编码字符集标准来决定。国家标准GB2312-80基本集共收录汉字6763个,其中常用字(一集字库)3755个,次常用字(二集字库)3008个。此外

3、,国家标准的两个辅助集收录了稀用字和罕用字共16000余个。2.汉字的字频     上述汉字编码字符集中汉字的选用是建立在汉字使用频率的统计基础上。例如国标一集字库3755个汉字在通用文献中的使用频率是99.9%,加上二集字库一共6763个汉字的使用频率覆盖了通用文献应用的99.99%。两个辅助集中的汉字的使用频率在万分之一以下。不过汉字的使用频率受时空的限制,在不同的时代背景下具有显著差异,在不同的专业领域中差异也很大。3.汉字的字形     在汉字的各种信息中,汉字的字形是最重要的一种。字形可以按照“汉字/部件/笔画”三个层次进行分解。汉

4、字字形的分解方式是汉字的输入与输出技术、以及汉字字模生成的基础。4.汉字的字音     汉字的字音是汉字输入、排序的基础。此外,是汉语语音的自动识别与合成技术中处理的对象。汉语是一种单音节语言,在汉字中同音现象十分突出。最多一音达120-130个字。5.汉字字义     语言的表现形式是“音”,其潜在内容是“义”,文字的表现形式是“形”,其潜在内容是“音”和“义”。每一个汉字都是多义的,对于语义歧义的处理是中文语音自动处理、机器翻译、自然语言理解等方面计算机人工智能技术发展的关键。1.2汉字的编码汉字编码是一种以编码代替汉字的语言,即对汉字字

5、形中的整字、部件或笔画分别以数字或字母代替,则字形就可以转换为一个数字串或字母串。这种转换为汉字编码。编码要求:键数少,效率高、重码少。记忆量少、规律性强、操作简单。1.3汉字编码方案1、字根代码类编码方案;将一个字分解成若干基本单元,每个单元以字母代替,然后将这些单元按照一定规律排列起来,就是一串字母,也就是该字的编码。2、字音代码类编码方案利用汉字的字音对汉字进行编码。由于同音字较多,需要全部显示出来进行二次选择。3、角形汉字是方块字,每个汉字都可看成有4个角。对角码输入法将汉字的各种角形归纳为5种,这就是:横(一)、竖(丨)、点(丶)、

6、叉(×)、角(ㄥ),并分别用1、2、3、4、5五个号码表示。4、音形结合1.4字形技术计算机字形技术包括字形的信息压缩、存储、还原、缩放等一整套处理技术。①点阵字体把一个汉字写在一张坐标方格纸上,区别有笔画处和无笔画处,空白处记作0,黑点处记为1,这样由0或1组成了这个汉字的点阵,顺序把点阵排列记录下来,形成一组数字,即为该汉字的字形信息,这就称为点阵成字。点阵字库是把每一个汉字都分成16×16或24×24个点,这类点阵字库汉字最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。②矢量字体矢量字体保存的是对每一个汉字的描述信息,比如一个笔

7、划的起始、终止坐标,半径、弧度等等。在显示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可以被无限地放大,笔划轮廓仍然能保持圆滑,打印时使用的字库均为此类字库。③曲线轮廓字(TrueType字和Postscript字)这种字库描述采用二次或三次曲线作为基础,用特殊的手段保证在平滑过渡点的连续性。这种字库解决了前几代字模存在的问题,不仅连续性好,字形美观而且变化丰富,不易走形。更好的符合印刷及高质量输出的要求。1.5字形压缩技术对精密汉字字库的存储则需要大量的存储空间。为了节省空间,往往采用字符压缩的方法

8、来存储。压缩点阵存储法基本原理是把汉字字形看作是简单的笔画组成,采用矩形或其他基本图案进行编码、存储。压缩点阵的特点:是简单直观,硬件比较简单,平均压缩率在40%左

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。