科技文献检索实用教程第3章计算机信息检索基础

科技文献检索实用教程第3章计算机信息检索基础

ID:43235140

大小:899.50 KB

页数:39页

时间:2019-10-06

科技文献检索实用教程第3章计算机信息检索基础_第1页
科技文献检索实用教程第3章计算机信息检索基础_第2页
科技文献检索实用教程第3章计算机信息检索基础_第3页
科技文献检索实用教程第3章计算机信息检索基础_第4页
科技文献检索实用教程第3章计算机信息检索基础_第5页
资源描述:

《科技文献检索实用教程第3章计算机信息检索基础》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第3章计算机信息检索基础13.1计算机化的文献信息源3.1.1文献的载体和媒体——信息、情报和知识的依托文献信息的载体除了物理的以外,还有逻辑的载体,即用什么符号或文字表达文献信息。为了与真实的载体区别,人们把字符之类的信息载体称为“媒体”或“媒质”(media)。(1)信息媒体的种类信息媒体是信息传播的形式,它们有符号、文字、声音、图像、动画等。 信息可从一种载体或媒体转移到另一种不同的载体或媒体上。信息必然始终附于某种“壳”(shell),即使是在转移过程中也是如此。(2)信息在空中的传播媒介空中传播的无线电广播电视信号,是将视频图像信号调制到载波(射频)频率上,利用地球磁场,把信

2、号送到千家万户。2图3.1无线电广播电视信号的组成3电视接收机收到信号后,经过高频头进行高频放大,再经过变频和3级中频放大,最后经过鉴频取出视频和音频信号。 图3.2是图文电视信号的发送原理。 可知,对于在空中传输的广播电视信号或图文电视信号而言: ◆载体:电磁波。 ◆媒体:电视信号制式。 ◆内容:电视节目或图文信息。 ◆情报:你热衷于收看的节目内容。 ◆知识:从情报中你得到了解的事物的规律性的东西。 结论:信息无论何时何地,即使在传输过程中,时时刻刻都不能离开物质载体和逻辑媒体。4图3.2图文电视信号的数据包插入广播电视信号中的位置5总之,文献必然有载体和媒体,在其上必然承载信息内容

3、,在信息内容中才可能含有情报(如果对人有用或有趣)或知识(如果有真实反映客观现实事物规律的东西存在的话)。文献的结构如图3.3所示。图3.3文献的结构63.1.2符号、文字、声音、图像、动画的特点比较作为多媒体的信息载体,文字、符号、声音和图像在传递信息上有着许多截然不同的特点。(1)符号符号最不直观,或最“抽象”,你可用一个极怪异的符号代表一种只有你自己才知道的含义。(2)文字文字则以其“永久”构成人类文明的历史。其表达信息的能力可以“明察秋毫”到无与伦比的程度。(3)声音声音表达信息的细节最为丰富,使用面最广。(4)图形和图像图形化的“语言”给人们带来丰富多彩的感受。7(5)动画动

4、画的交互性强,比其他媒体更有吸引力。动画作为一种交流手段,有着特有的表现形式和优点。3.1.3计算机化的文献信息源——ASCII码和汉字内码美国标准信息交换代码(ASCII)用8个位(bit)来表示一个ASCII码,构成一个字节(byte),因此一个字节就是信息、实质上是文献信息的最小构成单位。 汉字国标码是用2个字节表示的双7位编码,其内码实质上就是用扩展ASCII码字符集中的2个ASCII码。 汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下4类: ①按汉字的排列顺序形成的编码(流水码):如区位码。8②按汉字的读音形成的编码(音码):如全拼、简拼、双拼、

5、搜狗等。 ③按汉字的字形形成的编码(形码):如五笔字型、郑码等。 ④按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC。 常见的汉字编码有3种,即GB码(又称“国标码”,相当于我国的“ASCII”码,流行于我国大陆及新加坡,含简体汉字6763个);BIG5码(又称“大5码”,流行于我国港澳台地区,含繁体汉字13000个);HZ码(海外华人中曾流行)。3.1.4GBK汉字内码扩展规范 (1)GBK标准简介GBK是新的汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称ChineseInternalCodeSpecification,中国信息技术标准化技术委员会1995年1

6、2月1日制订,确定为技术规范指导性文件。9(2)编码特点GBK也采用双字节表示,编码范围为8140-FEFE。总计23940个码位,共收入21886个汉字和图形符号。 全部编码分为3大区域:汉字区、图形符号区和用户自定义区。(3)GBK的应用在基本操作环境方面,微软公司自Windows95简体中文版始,系统采用GBK代码。从浏览器IE4.0开始,简体、繁体中文版内部提供了一个GBK-BIG5代码双向转换的功能。 微软公司为InternetExporer提供的语言包中,简体中文支持的两种字库宋体、黑体,也是GBK汉字(珠海四通电脑排版系统开发公司提供)。其他一些中文字库生产厂商,也开始提

7、供TrueType或PostScriptGBK字库。 许多外挂式的中文平台,如南极星、四通利方(Richwin)等,提供GBK码10的支持,包括字库、输入法和GBK与其他中文代码的转换器。 在互联网方面,目前大多数中文搜索引擎,都能很好地支持GBK汉字的搜索。 便携式IT及通信产品方面,WINCE因与Windows一样同出于Microsoft,所以能很好地支持GBK,但PALM因中文化进展迟缓,到目前才比较成熟地支持GBK的产品,大部分手机由于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。