知识网络搜索引擎探析

知识网络搜索引擎探析

ID:9654939

大小:49.50 KB

页数:2页

时间:2018-05-04

知识网络搜索引擎探析_第1页
知识网络搜索引擎探析_第2页
资源描述:

《知识网络搜索引擎探析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、知识网络搜索引擎探析知识网络搜索引擎探析一、搜索引擎的发展  在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。  现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生AlanEmtage发明的Archie。虽然当时atthepStation、The.收集整理而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。  二、搜索引擎的分类  搜索引擎按其工作方式主要可分为三种

2、,分别是目录索引类搜索引擎(SearchIndex/Directory)、全文搜索引擎(FullTextSearchEngine)和元搜索引擎(MetaSearchEngine)。  (一)目录索引  目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定。  目前,搜索引擎与目录索引有相互融合渗透的趋势。原来

3、一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用OpenDirectory目录提供分类查询。而Yahoo!这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。  (二)全文搜索引擎  搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出蜘蛛程序,对一定IP地址范围内的互联网站进行检索,一旦发

4、现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向的向你的网站派出蜘蛛程序,扫描你的网站并将有关信息存入数据库,以备用户查询。  当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。  (三)元搜索引擎  元搜索引擎在接

5、受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。  三、新兴的网络检索技术  近几年网络搜索引擎发展迅速,出现了一些新兴的网络检索技术,下面主要介绍两种:  (一)在线百科系统  在线百科是一部开放的网络百科全书,也是一部由全体网民共同撰

6、写的百科全书。每个人都可以自由访问并参与撰写和编辑,分享及奉献自己所知的知识,所有人将其共同编写成一部完整的百科全书,并使其不断更新完善。  百科用开放、平等、自由、即时实现来回报广大网民的参与,调动广大网民无偿奉献自己知识的积极性。它被迅速接受的另一个重要原因,就是随着知识更新加快,人们越来越需要使用更为快捷的手段来创建、积累、分享彼此的知识。  (二)语义网络搜索  语义搜索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索

7、,从而更准确地向用户返回最符合其需求的搜索结果。  语义网络(SemanticNetwork)是一种出现比较早的知识表达形式,在人工智能中得到了比较广泛的应用。语义网络最早是1968年奎廉(Quillian)在他的博士论文中作为人类联想记忆的一个显式心理学模型提出的。1972年,西蒙正式提出语义网络的概念,讨论了它和一阶谓词的关系,并将语义网络应用到了自然语言理解的研究中。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。