欢迎来到天天文库
浏览记录
ID:52891926
大小:2.23 MB
页数:24页
时间:2020-04-14
《文本的信息加工.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库。
1、§4.1文本信息加工文字及其处理技术结绳说图画说仓颉造字说1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。一、文字及其处理技术体验文字处理技术字母文字以字母拼写方法的不同表达不同的含义象形文字使用自身的“形”直接昭示其含义汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字的造字法有四种:象形、指事、会意、形声。象形这是一个指事字。从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。指事金文「明」为日月幷照之会意字。会意东巴文字——现代活着的象形文字云南纳西族东巴文字猜
2、猜看,上面的象形文字究竟表示什么意思?一、体验文字处理技术1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。甲骨文殷周时代金文西周、春秋战国文字春秋战国小篆秦朝隶书秦朝楷书东汉行书南北朝草书西汉印刷字体宋朝2.书法是一种凝结了我国民族文化精髓的特殊的艺术形式兰亭集序(局部)晋·王羲之徐冰—方块英文将26个字母改造成类似中国汉字的偏旁部首ArtForThePeople一、文字及其处理技术历史上使用的文字处理技术,请按时间顺序排列:①活字印刷;②机械式打字机;③手写;④雕版印刷;⑤刻字;⑥计算机文字处理手写刻字雕版印刷活字印刷机械式打字机计
3、算机文字处理从古代的到现在计算机文字处理只能处理英文可处理包括象形文字在内的任何文字如何在计算机中处理汉字?Tiyanqingjing:pinyinyuhanzi体验情境:拼音与汉字村居(清)高鼎草长莺飞二月天,拂堤杨柳醉春烟。儿童散学归来早,忙趁东风放纸鸢。计算机文字处理技术发展只能处理拉丁字母以及一些控制符号过去可处理包括象形文字在内的任何文字现在ASCII码(美国标准信息交换码),可以表示128个字符GB2312(1980年)一共收录了7445个字符Big5(1984),一共收录了13060个字符GBK1.0(1995),收录了
4、21886个符号GB18030(2000),收录了27484个汉字和主要的少数民族文字Unicode(1994,统一码、万国码),它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。小结:从ASCII、GB2312到GBK1.0、GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。中文信息处理技术发展简史20世纪80年代初,CCDOS成为我国第一个汉字操作系统;1983年,“王码五笔字型”输入法,突破
5、了汉字数字化的瓶颈;1984年,联想公司成立并推出联想汉卡;1985年5月,北大方正研制的激光照排II型机,迎来了印刷业“告别铅与火,迈入光与电”的时代;1989年9月,金山公司发布了中文字处理系统WPS1.0;1992年,PTDOS1.0;1993年10月发布UCDOS3.0;1994年到1997年先后开发出UCDOS3.1~UCDOS7.0;1993年Windows3.2发布,这是第一个简体中文版的Windows操作系统,此后Windows及其中文版本不断升级;1999年,中国新一代的国产操作系统——红旗Linux推出。汉字的编码输入码(外码
6、)机内码(内码)输出码(字型码)用于输入汉字的编码用于存储汉字的编码用于输出汉字的编码字模16×16,24×24宋体、楷体、隶书等区位码:6625全拼编码:chun五笔字型:dw春用机内码表示、存储如国标码(GB)和BIG5码用汉字字型输出汉字(音码、形码、混合码)智能ABC,五笔字型等宋体楷体问题情境:丁丁是高一(18)班长,开学时要安排值日表,丁丁的计算机基础较好,于是就想通过电脑编制这个表格,以后修改更方便。可是,在他输入学生姓名的的时候,碰到了几个姓名怎么输也输不进去,你能帮他解决这个问题吗?汉字的编码输入码(外码):用于输入汉字,如区位
7、码、拼音码、王码(五笔字型)、自然码等。机内码(内码):用于储存汉字,如国标码(GB)、BIG5码等。汉字的编码输出码(字型码):字模(点阵、向量)●●●●●●●●●●●●→00010000→00010000→11111110→10010010→11111110→00010000→00010000→00010000●●●●●●●●●●●●●●●●●●●●●●●●●储存这个字型码需要8×8=64位二进制,即8个字节(1字节=8位二进制)补充说明:二进制一个二进制数的值:01001010bit(位)、Byte(字节):8b=1B1KB(千字节)=10
8、24B1MB(兆字节)=1024KB1GB(千兆字节)=1024MB补充说明:计算机存储容量单位及换算:体验文字处理技术汉字的编码文字及
此文档下载收益归作者所有