欢迎来到天天文库
浏览记录
ID:24798608
大小:4.50 MB
页数:34页
时间:2018-11-15
《因特网上的信息检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、使用不同的搜索引擎在网上获取信息资源改变关键词尽量少用通配符与含糊的词使用逻辑控制符AND,利用多个条件同时满足要求进行限制使用双引号“””(英文状态下)将连在一起的词变成短语来搜索用近义词代替关键词使用逻辑控制符OR使用其他的搜索网站讨论交流:哪些搜索技巧可以缩小搜索范围?3.2因特网上的信息检索3.2.1因特网信息检索方法因特网是全球性的分布式系统,信息组织处于一个无序的状态。基于超文本/超媒体的信息浏览基于目录服务的信息查询基于搜索引擎的信息检索1、基于超文本/超媒体的信息浏览能够灵活、方便地查找信息,但信息检索很
2、大程度上取决于所提供的链接,搜索结果带有偶然性和片面性。音频资料视频资料图形图像网页网页网页2、基于目录服务的信息查询人们根据信息的主题将网络上的资源进行分类,并以目录的形式组织和表现。一级二级三级四级3、基于搜索引擎的信息检索查询请求搜索引擎:信息检索工具查询结果:非资源本身资源的链接3.2.2搜索引擎的发展与分类1994年4月斯坦福大学两名博士生美籍华人杨致远和美国人DavidFilo超级目录索引雅虎最早的搜索引擎?1、搜索引擎的产生成功地使搜索引擎的概念深入人心从此搜索引擎进入了高速发展时期1990年起搜索引擎发展
3、举例产生时间搜索工具开发组或公司网站特点1990ArchieMcGillUnibersity可搜索FTP文件名列表1993GopherNevadaSystemComputingServicesUniversity一个分布式信息检索系统1994.4Yahoo斯坦福大学早期Yahoo数据是手工输入1995.12AltaVistaDEC公司第一个支持自然语言关键词和高级检索的引擎1997.10北大天网北大计算机研究室收录网页约6000万,有强大的FTP搜索功能1998.9Google斯坦福大学提供网页评级动态摘要、网页快照,每
4、天更新、多文档格式支持2001.8Baidu百度公司快照、预览、相关词搜索、mp3、flash搜索功能2搜索引擎的分类目录式搜索引擎全文搜索引擎元搜索引擎垂直搜索引擎集合式搜索引擎门户搜索引擎免费链接列表搜索引擎的分类类型定义举例目录搜索网络信息资源按照主题分类,并以层次树状形式进行组织的一类搜索引擎.优点:实实在在找到用户所关心内容分类,网站导航质量高缺点:分类不够细,需要人工介入,目录的维护量大,更新可能不够及时.搜索引擎的分类类型定义举例全文搜索使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎.优点
5、:信息量大、更新较及时、不需人工干预。缺点:返回信息过多,有很多无关信息。搜索引擎的分类类型定义举例元搜索引擎元搜索引擎就是通过一个统一的用户界面向多个搜索引擎同时递交用户查询,对结果去重合并再返回给用户.优点:结果精确、全面,汇聚各大搜索引擎的结果。缺点:检索速度较慢、牺牲个别搜索引擎性能,并非1+1=2如果你是搜索引擎公司的老总,谈谈什么是好的搜索引擎?搜索结果准确,搜索精度高响应速度快及时更新检索数据库,剔除“死链”思考搜索引擎技术的发展1、提高对用户检索提问的理解2、对检索结果进行进一步的处理3、确定搜索引擎信息
6、搜索范围,提高搜索引擎的针对性搜索引擎技术的发展1、提高对用户检索提问的理解自然语言的使用使网络交流更加人性化,让查询变得更加方便、直接、有效。案例:了解关于杀计算机病毒的方法。关键词1:计算机病毒关键词2:如何清除计算机病毒搜索引擎技术的发展2、对检索结果进行进一步的处理①基于链接评价的搜索引擎Google设计者认为:一个网页的重要性取决于他被其他网页链接的数量②基于访问大众性的搜索引擎这类搜索引擎的设计者认为大多数人选择访问的网站就是最重要的网站。③去掉检索结果中附加的多余信息搜索引擎技术的发展3、确定搜索引擎信息搜
7、索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化搜索引擎技术的发展3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化2、非WWW信息搜索:提供FTP类信息的检索搜索引擎技术的发展3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化2、非WWW信息搜索:提供FTP类信息的检索3、多媒体搜索引擎:实现多媒体检索搜索引擎技术的发展1、提高对用户检索提问的理解2、对检索结果进行进一步的处理3、确定搜索引擎信息搜索范围,提高搜索
8、引擎的针对性3.2.3搜索引擎的工作过程信息检索人工智能计算机网络分布式处理数据库数据挖掘数字图书馆自然语言处理……搜索引擎是一个交叉的研究领域,极具综合性和挑战性。目录式搜索引擎的工作过程以人工方式或半自动方式搜集信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中。用户通过浏览分类目录来查
此文档下载收益归作者所有