搜索引擎技术及发展趋势

搜索引擎技术及发展趋势

ID:4249990

大小:339.55 KB

页数:22页

时间:2017-11-30

搜索引擎技术及发展趋势_第1页
搜索引擎技术及发展趋势_第2页
搜索引擎技术及发展趋势_第3页
搜索引擎技术及发展趋势_第4页
搜索引擎技术及发展趋势_第5页
资源描述:

《搜索引擎技术及发展趋势》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、搜索引擎技术及发展趋势李晓明,张岩北京大学信息科学技术学院摘要:搜索引擎因其获取信息的方便快捷,正在渗透到人们生活的方方面面,其影响在不断扩大和加强。成长中的Web,不断提高的用户需求,变化的网络环境,这些都对搜索引擎提出更高更新的要求,同时一些非技术因素也给搜索引擎的进一步发展带来挑战。本文分析了搜索引擎面临的诸多挑战,总结了搜索引擎应对方略的要点。本文最后列举了国内外代表性研究团体的研究进展,并对搜索引擎的未来做出了展望。SearchEngineTechniquesandTrendsXiaomingLiandYanZhangSc

2、hoolofElectronicsEngineeringandComputerScience,PekingUniversityAbstract:Searchengines,invirtueoftheirpowerfulandconvenientaccesstoinformation,areinfiltratingintoalmostallaspectsofthesocialsociety.However,higherrequirementsareconstantlyputtosearchenginesduetothegrowing-

3、upweb,theever-increasinguserdemandsandthechangingnetworkinfrastructure.Meanwhile,somenon-technicalfactorsalsoforcesearchenginesgoingdeeper.Thisreportanalyzesthevariouschallengesfacedbysearchengines,andsummarizesthemainpointsofthesolution.Inaddition,alistoftherelatedres

4、earchgroupsispresented,followedbyanoverlookofthesearchengines'future.一、引言“搜索引擎”作为互联网上提供信息服务的一种工具,现在几乎已经是一个妇孺皆知的事物。按照中国互联网络信息中心在2006年7月19日发布的报告[1],中国网民中有66.3%经常使用搜索引擎,比半年前又提高了近1个百分点。互联网上的第一代搜索引擎出现于1994年前后,以AltaVista、Yahoo和Infoseek为代表,搜索结果的好坏通常用反馈结果的数量来衡量,或者说是“求全”。然而研究表明

5、,当时的搜索引擎性能并没有想象中的那么优秀,根据SteveLawrence和C.LeeGiles在1999年2月的实验[3],全球11个主要的搜索引擎中,每个搜索引擎仅能搜索到互联网上全部页面的16%,甚至更低。造成这种情况的原因,主要是这些搜索引擎的处理能力和网络带宽等方面的限制。1图1Relativecoverageoftheenginesforthe1050queriesusedduringtheperiodFeb.25–28,19991998年,以Google为代表的第二代搜索引擎出现在互联网上,其主要特点是提高了查准率,或

6、者说“求精”。当时传统的搜索引擎如Lycos等主要使用网页中的关键词进行搜索,而Google则使用了一种综合页面排名算法:它不仅考虑搜索关键词,还考虑页面间的链接关系,然后对整个网络的链接结构进行分析和迭代计算,从而对页面进行区分[4]。第二代搜索引擎在技术和商业上都获得了巨大成功,然而商业竞争和信息环境的变化仍在推动着它们不断创新和发展。当前所谓的第三代搜索引擎主要增加了互动性和个性化等技术,为用户使用搜索引擎获取信息提供更好的体验。至于互动性的评价标准是什么,以及第三代搜索引擎到底比第二代增加了多少价值,目前并没有非常令人信服的

7、研究结论。在以下的论述中,我们不对产品概念进行太多讨论,而是就搜索引擎目前所面临的挑战以及它们的应对方略和发展趋势进行梳理和阐述。二、搜索引擎面临的挑战面对瞬息万变的环境,搜索引擎如果在技术上不创新进取,从信息服务质量的角度讲,现在看来不错的,将来很可能会落伍。不进则退,在搜索引擎领域体现得很明显。关于搜索引擎的基础技术,读者可参见[23],那么目前有些什么变化在影响着搜索引擎呢?(一)Web的发展1.信息仍在大量增加Web自产生以来,其信息量一直以几何级数的形式递增,近两年来尤其如此。这主要有两方面原因:首先是Web2.0[16]

8、的用户和以前的有所不同,他们正在由单纯的信息消费者向生产者与消费者双重身份转变;其次是DeepWeb[7]的发展。2如果说Web1.0是单纯的网页浏览模式,那么Web2.0则是通过了真正的个性化、去中心化和信息自主权,向着内容更丰富、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。