互联网信息检索原理

互联网信息检索原理

ID:39252363

大小:1009.51 KB

页数:80页

时间:2019-06-28

互联网信息检索原理_第1页
互联网信息检索原理_第2页
互联网信息检索原理_第3页
互联网信息检索原理_第4页
互联网信息检索原理_第5页
资源描述:

《互联网信息检索原理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、信息文化教程主讲张沛黎电话:2057357(o)手机:13095097299石河子大学图书馆文检教研室E-mail:zhangpeili57@163.com10/4/20211zhangpeili第五章互联网信息检索原理5.2互联网信息概述互联网,或称环球网、因特网、Internet,是指多个网络通过路由器、通信线路等通信设备互联,并基于一个共同的TCP/IP协议实现通信的世界性计算机网络。它是在美国1969创建的军用网络的基础上逐步发展成型的。可以预见,Internet必将迅速覆盖全球,对人类生活产生深远的影响,使“信息时

2、代”真正到来。10/4/20212zhangpeili第五章互联网信息检索原理网上信息资源的构成互联网信息资源是由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。网络信息包括计算机中的数据库、电子出版物、主页信息、软件以及各种格式的文件。信息工具包括FTP、Telnet、Email、Gopher、Archie、WAIS、WWW浏览器、搜索引擎等。网络通信渠道是指网络提供的信息交流的渠道。10/4/20213zhangpeili第五章互联网信息检索原理网上信息资源的特点:(1)数量庞大、增长迅速互

3、联网上的信息资源极其丰富。已经成为全球最大的信息资源。包括有哲学、社会科学和自然科学等各学科方面的知识。(2)更新频繁、变化无常互联网上的信息源常常是不稳定,许多网站不断地更换网址,这些给利用带来许多的不便。(3)分布散乱、良莠混杂互联网上的资源,一部分是人类知识的精粹,是人类巨大的财富,还有相当一部分是出于某种目的的信息或者是未经任何审核的数据信息,我们必须要有足够的认识和警觉。10/4/20214zhangpeili第五章互联网信息检索原理3.网络信息资源的类型按照出版类型区分网上信息资源有着和印刷型出版物类似的对应关系

4、。如:印刷型的期刊有网络期刊与其对应。印刷型的图书有网络图书与其对应。如此等等。按照是否具有原创性网上信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。10/4/20215zhangpeili第五章互联网信息检索原理按照有否经过审核,网上信息资源可分为正式出版物和非正式出版物两种。正式出版物学术价值相对较高。例如电子期刊、电子图书、电子报告、电子会议录等。网上正式出版物可以免费使用的很少。网上的非正式出版物具有明显的个人行为性质,其学术价值变化较大。例如个人主页、讨论组文章和公告

5、版文章等,它们基本上可以免费利用。10/4/20216zhangpeili第五章互联网信息检索原理按照是否属于搜索引擎检索范围,网络信息资源可分为可见资源和不可见资源两类。可见资源是搜索引擎可搜索到的资源。这种资源要满足两个条件:一是必须含有HTML超链接。二是没有设置口令,因而可见资源仅限于公开的资源。不可见资源,具体的说,是指一切没有联接的资源。10/4/20217zhangpeili第五章互联网信息检索原理5.2.3网络信息资源利用的几个概念1.HTML和XML超文本标识语言(HyperTextMarkupLangua

6、ge,简称HTML),是为WWW建立超文本文件的语言。超文本文件是指含有多个指向其它文本、图像、声音或动画文件的指针,使它们连接在一起的文件。超文本标识语言通过链接项链接文件与文件或者文件内部不同部分,由此实现在INTERNET上的漫游。用HTML编写的超文本文档必须用WWW浏览器阅读。可扩展标识语言(XML,ExtensibleMarkupLanguage)正在成为各种数据,尤其是文档的首选格式,其优点是跨平台、跨网络、跨程序。10/4/20218zhangpeili第五章互联网信息检索原理2.2.网站和网页网页是用HTM

7、L或DHTML、XML等语言写成的文本文件。网站则是有独立的域名,由若干相关网页组成的一个站点。按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个web站点就是一本书,每个web页面就是书的一页,主页则是书的封面和目录。用户可以从主页开始,通过web链接访问各类信息资源,在WWW世界中漫游。10/4/20219zhangpeili第五章互联网信息检索原理3.WWW和WWW浏览器WWW是worldwideweb的缩写,可以称为“全球信息网”。简称3W或Web,有时中文也称为万维网。WWW的这种遍布全球

8、的信息网络是通过超文本和超媒体(Hypermedia)技术来实现的。在Internet中,每个web服务器不仅提供它自身拥有的信息数据,还利用超级链接指向其它的拥有相关信息的web服务器,而那些服务器又指向更多的服务器,通过这种内部的链接机制,使遍布全球的主机形成了一个相互联系、资源共享的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。