《网络信息的检索》PPT课件

《网络信息的检索》PPT课件

ID:39059907

大小:7.13 MB

页数:120页

时间:2019-06-24

《网络信息的检索》PPT课件_第1页
《网络信息的检索》PPT课件_第2页
《网络信息的检索》PPT课件_第3页
《网络信息的检索》PPT课件_第4页
《网络信息的检索》PPT课件_第5页
资源描述:

《《网络信息的检索》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、网络信息的检索一、网络信息的特点1.信息源数量庞大、增长迅速2.信息内容丰富、多样,覆盖面广3.传输速度快、共享程度高4.交叉性强、分布广泛而不均匀5.变化频繁、动态性强6.信息使用成本低7.信息质量良莠不齐二、搜索引擎网络搜索引擎的历史最早可以追溯到1991年,尽管搜索引擎发展时间并不长,但其观念却是深入人心的。《第22次中国互联网发展状况统计报告》显示,在中国2.53亿网民中,搜索引擎的使用率为69.2%,达1.75亿。目前为中国第五大网络应用技术。从数据中不难看出,网络搜索引擎所发挥的作用是非

2、常大的。工作原理搜索引擎是互联网上的分布式搜索系统,它在传统数据库检索技术基础上,增加了自动收集和更新数据库信息的功能,并采用人工智能方法对检索结果进行区分和排序。主要由信息采集器、查询表和检索接口三大模块组成。搜索引擎系统的分类1.机器人搜索引擎由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器将用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人

3、工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。2.目录搜索引擎以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确,导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。严格意义上算不上真正的搜索引擎。Dmoz:opendirectoryproject:是世界上最大也是最好的网站分类目录主页3.元搜索引擎也称集成搜索

4、引擎。是对搜索引擎进行搜索的搜索引擎。它可以没有自己的资源库和机器人,仅充当一个中间代理的角色,接受用户的查询请求,讲请求翻译成相应搜索引擎的查询语法。在向各个搜索引擎发送查询请求并获得反馈后,进行综合相关度排序,然后把整理后的查询结果发送给用户。Dogpile共收集了26个搜索引擎,包括WEB检索、新闻组检索、FTP检索、新闻检索、股市检索、黄页检索、白页检索、地图检索、天气检索等。http://www.baigoogledu.net/弥补了用单一搜索引擎寻找到的内容不全面的缺憾。常用搜索引擎介绍

5、1.百度www.baidu.com1999年底,百度成立于美国硅谷,2000年1月创立于北京中关村,是目前全球最大的中文搜索引擎。百度的起名,来自于“众里寻她千百度”的灵感,它寄托着百度公司对自身技术的信心,象征着百度对中文信息检索技术的执著追求。百度除数据库的规模及部分特殊搜索功能外,其他方面可与当前的搜索引擎业界领军人物Google相媲美,在中文搜索支持方面有些地方甚至超过了Google,是目前国内技术水平最高的搜索引擎之一。成为“最受欢迎的中文搜索引擎”和“全球最大的中文搜索引擎”(百度自称)

6、,其数据库中存有3亿页网页。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。百度主页百度国学和端午相关的诗词古代典籍对普洱的描述古诗《静夜思》2.Googlewww.Google.com成立于1997年9月,几年间迅速发展成为目前规模最大的搜索引擎,目前Google每天处理的搜索请求已达2亿次!而且这一数字还在不断增长。Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除

7、特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从10到100条任选。提供网站内部查询和横向相关查询。Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择,包括英语、主要欧洲国家语言(含13种东欧语言)、日语、中文简繁体、朝语等。同时还可以在多达40多个国别专属引擎中进行选择。Google主页1.糖醋排骨Google的基本检索算符是:空格、减号和“OR”,逻辑“与”(AND)用空格代替。“糖醋排骨做法”,注意空格的使用空格在搜索中起到的作用是非常大的,如果想

8、查询中国跨度最大的公路隧道,可以这样搜索:“中国跨度最大公路隧道”使用减号-有时你可能在查询某个题材时又不希望在这个题材中包含另一个题材,这时你就可以使用减号了。比如你想查询有关冯小刚的文件,但又不希望看到有关葛优的消息,用google检索你可以这样查找:冯小刚–葛优(注意减号前有一个空格)减号的作用在于可以使搜索结果集中反映你的需求,而你无需为大量无关的搜索结果而头疼。减号前不加空格的检索结果松茸保鲜检索结果松茸-姬松茸保鲜的检索结果使用引号“”通过添加英文双引号来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。