试比较垂直搜索引擎和传统的搜索引擎

试比较垂直搜索引擎和传统的搜索引擎

ID:5220210

大小:36.50 KB

页数:7页

时间:2017-12-06

试比较垂直搜索引擎和传统的搜索引擎_第1页
试比较垂直搜索引擎和传统的搜索引擎_第2页
试比较垂直搜索引擎和传统的搜索引擎_第3页
试比较垂直搜索引擎和传统的搜索引擎_第4页
试比较垂直搜索引擎和传统的搜索引擎_第5页
资源描述:

《试比较垂直搜索引擎和传统的搜索引擎》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、试比较垂直搜索引擎和传统的搜索引擎摘要:搜索引擎以其强大的检索功能备受社会关注,各种类型的搜索引擎更是层出不穷。本文选取了垂直搜索引擎和传统搜索引擎作为比较对象,从工作原理、核心技术、信息服务这三个方面进行了比较,最后总结出搜索引擎发展的方向就是更好的为用户提供服务。关键词:垂直搜索引擎;传统搜索引擎;比较搜索引擎主要指利用网络自动搜索技术软件或人工方式,对网络资源进行收集、整理与组织,并提供检索服务的一类信息服务系统。随着网络和计算机技术的快速更新,各种类型的搜索引擎层出不穷。由于搜索引擎查询的海量结果存在信息量大、查询不准确、深度不够等缺陷,用户感觉到很难在短时

2、间内准确的筛选并找到符合需求的信息。于是,垂直搜索引擎便应运而生。那么,它到底和传统的搜索引擎有何不同呢?1.垂直搜索引擎和传统搜索引擎概述传统搜索引擎就是早期的综合搜索引擎的统称。它是指定期收录和整理网络信息,提供关键词或浏览查询方式的网络信息检索工具。其资源包罗万象,用户可在检索栏中输入检索词来检索几乎任何类型和主题的资源。虽然它收录的资源范围广,但存在死链接较多、相关度较低等缺点。垂直搜索引擎即专业化搜索引擎,是专为查询某一学科或主题的信息而产生的查询工具。它是对某类网页资源和结构化资源的深度整合后提供符合专业用户操作行为的信息服务方式。其特点是“专、精、深”

3、,且具有行业色彩。因为它的搜索器只搜集特定的主题信息的相关网页。这样大大降低了收集信息的难度,提高了信息的质量。2.工作原理比较传统的搜索引擎是通过spider程序来自动地在互联网中搜集和发现信息,再由索引器为搜到的信息建立索引,最后由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。由于网页文件存在不规范性,传统搜索引擎所建立的索引是全文索引。垂直搜索引擎先利用特定的软件按照用户需求自动从网络服务器上搜索信息资源;再按照专题进行人工分类,建立索引,将索引好的内容存放到本地数据库。用户在检索时只需利用搜索引擎的界面接口输入检索要求,后台数据库检索软件对其进

4、行处理,并将结果反馈给用户,用户可根据返回的摘要信息决定是否要继续访问原始站点,以得到更为详细的信息。由此可知,它们的工作原理是很相似的,不过垂直搜索引擎的后台索引数据库是在计算机自动搜索与人工分类相结合基础上建立的,它既能及时补充网上随时更新的信息,又能满足用户按照科学的分类体系准确的查询到满意的信息。3.核心技术比较传统搜索引擎是在整个互联网的网页中查找信息。依赖于搜索技术,抓取、索引、排序等技术。而垂直搜索引擎只在特定主题的网站上查找。采用的主要技术包括spider、网页结构化信息抽取技术、元数据采集技术、分词技术、索引技术等信息处理技术。所以,垂直搜索引擎可

5、以针对专业特定的领域或行业的内容进行专业和深入的分析挖掘和定位,更精准的提供有一定价值的信息和相关服务,有效地弥补了传统的综合搜索引擎对专门领域及特定主题信息覆盖率过低的问题。同时,能够把具有相同兴趣点的人们集中在一个“主题社区”内,不仅集中提供各种专业资源,而且给大家提供了一个相互交流、共享经验和教训、展望行业发展前景的机会和场合。相比较传统搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。4.信息服务的比较(1)服务用户比较传统搜索引擎为用户提供一个的检索入口,它准备了与用户提问相关的各种网络资源,供用户自行筛选。其用户群覆盖范围较广泛,涉及了所

6、有类型的网络资源使用者。垂直搜索引擎的用户有明确的信息需求,这种信息需求可以界定在某一个特定范围内,并且满足其信息需求的信息产品是特定形式的组织化的信息,它提供的结果都是与用户需求相关的,用户不用自己再进行分析和判断。传统搜索引擎对用户的要求相对较高,在搜索的过程中,需要有用户对自己需求的不断调整的过程。垂直搜索引擎对用户的要求较低,直接输入检索需求即可。所以,传统的搜索引擎用户规模比较大,但是用户的需求不太明确;而垂直搜索引擎的用户需求相对明确。(2)信息服务内容比较对于搜索引擎而言,为用户提供的内容就是搜索结果。两种搜索引擎都可以提供与用户提交检索式相关的网上检

7、索结果,但它们存在很大区别。信息的时效性从信息搜索及时性来分析,垂直搜索引擎需要获取的信息来自于某一特定领域的,这比起传统的搜索引擎漫无边际的信息抓取,具有实时性优势。由于网上的信息量巨大,传统搜索引擎的数据更新周期短则十几天,长则几个月,而垂直搜索引擎的数据更新可以以秒为单位。信息的描述。在描述形式上,传统搜索引擎提供的信息是网页链接,其匹配原则是网页描述与关键字的相关度;垂直搜索引擎提供的结果是结构化的数据。在描述内容上,传统搜索引擎的结果的描述的内容包括标题、描述、url链接三个部分。它们是当前url链接上的网页整体内容的介绍,而不是针对用户检索的特定信息

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。