《搜索引擎教学》PPT课件

《搜索引擎教学》PPT课件

ID:37027972

大小:300.60 KB

页数:66页

时间:2019-05-10

《搜索引擎教学》PPT课件_第1页
《搜索引擎教学》PPT课件_第2页
《搜索引擎教学》PPT课件_第3页
《搜索引擎教学》PPT课件_第4页
《搜索引擎教学》PPT课件_第5页
资源描述:

《《搜索引擎教学》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、搜索引擎教学何晓阳Thewebcreatesnewchallengesforinformationretrieval.SergeyBrinandLawrencePage《TheAnatomyofaLarge-ScaleHypertextualWebSearchEngine》 1998年4月在WWW年度大会上发表,引起全球学术界广泛关注。目前该文被引用309次。内容:网络资源的特点 搜索引擎 医学搜索引擎 实例网络资源的特点(与传统数据库相比)内容丰富,应有尽有。更新变化太快,不确定性高。有待于规范化、标准

2、化。(能规范化吗?)检索没有定式,没有标准答案。搜索引擎介绍起源:所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity三名学生(AlanEmtage、PeterDeutsch、BillWheelan)发明的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确

3、的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。起源:由于Archie深受欢迎,受其启发,NevadaSystemComputingServices大学于1993年开发了一个Gopher(GopherFAQ)搜索工具Veronica(VeronicaFAQ)。Jughead是后来另一个Gopher搜索工具。发展:世界上第一个Spider程序,是MITMatthewGray的WorldwideWebWanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来

4、则发展为也能够捕获网址(URL)。搜索引擎一般由以下三部分组成:爬行器(机器人、蜘蛛)索引生成器查询检索器发展:改进:假设所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:TheWorldWideWebWorm、NASA的Repository-BasedSoftwareEngineering(RBSE)spider。RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜

5、索结果排列中引入关键字串匹配程度概念的引擎。发展:Excite的历史可以上溯到1993年2月,6个StanfordUniversity(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做ExciteforWebServers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用

6、元搜索引擎Dogpile)关于斯坦福大学(一)本科阶段排名5(二)商学院1(三)教育学院--研究能力1(四)工学院2(五)法学院2返回发展:1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavis

7、ta、Inktomi、Google提供搜索引擎服务)Yahoo!---几乎成为20世纪90年代的因特网的代名词。发展:1995年,一种新的搜索引擎形式出现了——元搜索引擎(MetaSearchEngine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生EricSelberg和OrenEtzioni的Metacrawler。元搜索引擎概念上好听,但搜

8、索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。发展:DEC的AltaVista是一个迟到者,1995年12月才登场亮相。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。在当时,Altavista最突出的优势是它的速度(据说,设计altavista的目的,据说只是为了展示DECAlpha芯片的强大运算能力)。而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。