垂直搜索引擎简析.docx

垂直搜索引擎简析.docx

ID:57843451

大小:19.15 KB

页数:6页

时间:2020-03-31

垂直搜索引擎简析.docx_第1页
垂直搜索引擎简析.docx_第2页
垂直搜索引擎简析.docx_第3页
垂直搜索引擎简析.docx_第4页
垂直搜索引擎简析.docx_第5页
资源描述:

《垂直搜索引擎简析.docx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、江苏师范大学物电学院Web信息检索论文课程名称:Web信息检索题目:垂直搜索引擎专业班级:11物41学生姓名:徐凤新学生学号:日期:2013年12月28日指导教师:姜芳艽垂直搜索引擎简析引言随着互联网的快速发展,导致网络信息资源呈指数增长,通用搜索引擎在信息采集、存储等方面面临很大的挑战。此外,工作频率不断加快的公司员工对通用搜索页面中的大量非目标源信息感到不满,开始对专业领域的搜索精确性产生强烈需求,因此面向专业领域的搜索引擎——垂直搜索引擎应运而生。相对于通用搜索引擎的查询不准确、深度不够等局限性,垂直搜索引擎能给特定用户提供某一领域的更专业的信息和服务。垂直

2、搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。一.定义垂直搜索引擎是应用于某一个行业、专业的搜索引擎,是搜索引擎的延伸和应用细分化。垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。二.发展前景 搜索引擎的出现

3、,整合了众多网站信息,恰恰起到了信息导航的作用。通用搜索引擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所有网站上的信息整理在一个平台上供网民使用,于是信息的价值第一次普遍的被众多商家认可,迅速成为互联网中最有价值的领域。互联网的低谷由此演变为第二次高峰。大家熟知的搜索引擎Google、百度、雅虎等是通用搜索引擎现如今的杰出代表,他们为互联网的发展做出了重要的贡献。然而,搜索引擎行业也不是一家公司就可以独撑天下的,从百度的上市、yahoo中国的并购一系列动作表明,如今的搜索引擎大战如同门户网站初期的竞争一样激烈。相信,通用搜索引擎在经历

4、过一段时间的角逐后,也将会继续维持几大服务商各自分控一部分市场的局面。 垂直搜索引擎概念的提出,就是针对性的为某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。可以简单的说成是搜索引擎领域的行业化分工。众多专业性网站、行业网站独立服务于互联网的成功,恰恰证明了互联网的格局应该是多方面的。通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息需求服务。市场需求多元化决定了搜索引擎的服务模式必将出现细分,针对不同行业提供更加精确的行业服务模式。可以说通用搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,势必将出现垂直搜索引擎在

5、互联网中占据部分市场的趋势,也是搜索引擎行业细分化的必然趋势。三.垂直搜索引擎和传统搜索引擎的异同点垂直搜索不只是类google的行业通用搜索。以房产行业为例,如果我们按照google抓取网页的方式,来建造一个房产行业google的做法,是行不通的。技术壁垒不用解释,就算我们借助nutch,lucene等搜索技术来做,我们也无法提供差异化的服务,而没有差异化的产品在互联网赢家通吃的规则下是无法生存的,就是不要简单地模仿,而要想办法形成互补。1.技术相同  垂直搜索和目前的google,baidu等通用搜索从定位,内容,用户,市场策略等都是不同的。所以垂直搜索不只是

6、简单的行业google。用户使用google,baidu等通用搜索引擎的方式是通过关键字的方式实现的,是语义上的搜索,返回的结果倾向于知识成果,比如文章,论文,新闻等;垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息,消息,条目等。这个特性是他们各自的的技术特点决定的。打个比方,如果google搜索引擎是一个正金字塔型,那么垂直搜索引擎就是个倒金字塔型,两者是互补的。2.垂直搜索的特点:  1、搜索是一个产业商业联盟的平台,一个集成产业链的上下游公司的搜索门户。  2、垂直搜索的表现方式和google,baidu的表现方

7、式不同,结构化的搜索和非结构化搜索并用。3、从广告模式上提供了除googleadsense和百度竞价排名广告之外的另一种可能。四.垂直搜索引擎的主要技术指标1.信息采集技术:垂直搜索引擎spider和网页库的spider相比应该是更加专业,可定制化。可定向性的采集和垂直搜索范围相关的网页忽略不相关的网页和不必要的网页,选择内容相关的以及适合做进一步处理的网页深度优先采集、对页面有选择的调整更新频率……,采集可通过人工设定网址和网页分析url方式共同进行。  一般互联网搜索面向全网信息,采集的范围广、数量大,但往往由于更新周期的要求,采集的深度或说层级比较浅,采集动

8、态网页优先

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。