欢迎来到天天文库
浏览记录
ID:19862026
大小:1.48 MB
页数:59页
时间:2018-10-07
《第4章 网络信息检索2016》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、网络信息检索2021/9/154.1网络信息检索4.2搜索引擎4.3学术搜索4.4开放存取主要内容2021/9/154.1网络信息检索特点检索范围广用户界面友好且操作方便检索途径灵活且速度快捷人机交互检索效率不高主要检索技术智能代理技术网络信息挖掘技术信息推送技术2021/9/154.2.1搜索引擎技术的发展4.2.2搜索引擎的工作原理4.2.3搜索引擎的分类4.2.4Google小窍门4.2.5Baidu小窍门4.2搜索引擎2021/9/154.2.1搜索引擎技术的发展第一代——门户成为终点第二代——以超链接分析为基础的机器抓取技术为基础第三代——综合性技术的应用2021/9/15第一代搜
2、索引擎第一代的搜索引擎公司都变成了门户网站,垂直化的搜索引擎也应运而生,如,专门做图形图像或MP3文件的搜索引擎。而最新的技术是动态的网页搜索和实时内容的检索,网络上越来越多的网页是根据程序生成的,而不是静态地存在。这些页面都是根据时间变化而变化的,比如查询股票的价格等。而实时的内容多是新闻与金融信息,这也是广大网民迫切需要的。2021/9/15Excite(www.excite.com)Excite是斯坦福大学的6位计算机系的本科生创办的。“免费让人搜索,用广告收入来补贴”,这是Excite率先提出来的。Excite搜索技术研发人员的计算机功底扎实,但对信息检索的认识不是很深,提出的概念搜
3、索(ConceptSearch),即用同义词推断来增加搜索的结果很快就宣告失败。2002年被Infospace收购,改用元搜索引擎Dogpile。2021/9/15Altavista诞生于DEC研发中心,第一个支持自然语言检索,第一个实现高级搜索,它也是Yahoo!最早的搜索引擎技术的提供者。特点:速度快,可以提供许多不同格式内容,如音频、视频与多国语言的检索,可以说处于世界领先地位。缺点:更新频率不是很快。Altavista(www.altavista.com)2021/9/15Lycos(www.lycos.com)Lycos是早期搜索引擎中唯一诞生于美国东部的,其余的搜索引擎都在硅谷。
4、它脱胎于卡耐基·梅隆大学的一位博士生的一套互联网搜索程序,此后被风险投资集团CMGI看中,并且在波士顿成立了公司。其搜索技术一直比较落后,但在商业上比较成功,Lycos很早就投资做社区网站。2021/9/15Infoseek(www.infoseek.com)Infoseek以检索的相关程度高而知名。Infoseek请一位华人工程师WilliamChang设计了第一代Infoseek搜索引擎Ultraseek,其特点是速度快,检索结果的相关程度也很高。产品一推出在搜索引擎领域与华尔街都引起了很大的震动。1999年,Infoseek被Disney所购买,发展方向与定位都做了调整。Disney将
5、其做为入门网站Go.com的搜索引擎,在技术上的革新比较少,主要是做娱乐方面的索引。2021/9/15Yahoo!(www.yahoo.com)创办于1994年,创办人为美籍华人杨致远和DavidFilo。因为数据为手工输入,只能支持简单的数据库搜索。2002年采用Google的搜索结果,2004年正式推出自己的全文搜索引擎。2021/9/15第二代搜索引擎第二代搜索引擎厂商的特点是只做后台技术的提供者,这是美国互联网发展的教训。因为作为一个公司,同时肩负两个任务,一是创建门户类的平台,二是开发搜索引擎,这两方面没有什么共同点,使得网站精力分散,不能全力投入搜索引擎技术的改进;而且两者合一意
6、味着自己的产品不能卖给别人,搜索引擎的开发的成本相当高,又只能少数几家使用,这就不符合软件通用化的潮流与模式。第一代网站中,只有Yahoo!不自己开发搜索引擎,所以它成功了。2021/9/15Inktomi(www.inktomi.com)Inktomi是加州大学伯克利分校EricBrewer的教授最先研究,这位教授是并行处理研究的专家。后来他将技术卖给了Hotbot,作为后台技术的提供商。EricBrewer完成Inktomi的时候,市场竞争已经相当激烈,做门户已经不可能,所以他决定只做背后技术的提供商。Yahoo!以前使用的是Altavista的技术,但Altavista本身也是门户,与
7、Yahoo!处于竞争关系,所以Inktomi很快成了Yahoo!后台技术的提供商。目前已无此网站。2021/9/15Askjeeves(www.ask.com)从技术上讲,Askjeeves是一个比较简单的系统,但从创意来说是相当出色的,它维护了问题与答案相联系的数据库。从结构上说它比较简单,因为提问后并不是立即返回问题的答案,而是用逼近式的方法让你选择他知道的所有问题,再由用户分类来选择答案。这一点从技术上
此文档下载收益归作者所有