欢迎来到天天文库
浏览记录
ID:1353715
大小:2.23 MB
页数:61页
时间:2017-11-10
《1网络信息资源检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、网络信息资源检索学习、生活中所需的资料1、考研、考博信息2、出国留学的所有信息3、火车时刻表、航班、万年历等4、旅游信息等……科研工作中所需的资料1、查找相关领域的最新研究进展2、查找科研成果的转化对象3、查找原始文献的出处网络能带给我们什么?网络信息资源检索概述:网络信息检索一般要通过信息的收集、整理、分类、索引从而产生数据库以供检索。网络信息检索困难原因分析信息资源分散信息数量庞大检索软件智能低1搜索引擎的发展与含义迅速、准确获取自已最需要的信息网络信息资源每4个月翻一番信息内容涉及广泛信息类
2、型众多Data?为什么要出现搜索引擎1994年7月,MichaelMauldin将JohnLeavitt的蜘蛛程序接入到其索引程序中,创建了Lycos。1995年4月,斯坦福(Stanford)大学的两名博士生,DavidFilo和美籍华人杨致远(GerryYang)共同创办了超级目录索引Yahoo。1990年由蒙特利尔大学学生AlanEmtage发明的Archie—以文件名查找文件的系统现代意义上的搜索引擎的祖先1993年MatthewGray开发的WorldwideWebWanderer————
3、被称为“蜘蛛”程序第一个用于监测互联网发展规模的“机器人”程序最早现代意义上的搜索引擎搜索引擎的发展:以Google、Inktomi和百度为代表Google其数据库中存放的网页已达30亿现在的搜索引擎——第四代搜索引擎搜索引擎的搜索引擎搜索引擎之间出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。国外的Inktomi本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度向搜狐
4、和新浪提供全文网页搜索服务技术。搜索引擎是因特网上专门提供检索服务的一类网站,是在网络信息资源中主动搜索信息(搜索网页上的有意义的单词和简短的对特定内容的描述的词)并将其自动标引的Web网站,其标引的内容储存在可供检索的大型数据库中,并建立相应的索引和目录服务,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。搜索引擎广义的含义:搜索引擎Web服务器信息检索信息组织机制信息采集机制数据库客户浏览器网络Web站点Web站点FTP站点新闻组Web站点工作原理在互联网中发现、搜集网页信息对信
5、息进行提取和组织建立索引库根据用户输入的查询条件,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。信息搜集系统索引数据库查询接口2搜索引擎工作流程与类型网络技术数据库技术自动标引技术检索技术自动分类技术机器学习等人工智能技术涉及的相关技术全文搜索引擎按搜索机制划分目录索引搜索引擎的类型从搜索结果来源的角度再分:全文搜索引擎由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,通过从互联网上提取的各个网站的信息(以网页
6、文字为主)而建立的数据库中,再根据用户的查询检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。一种是拥有自己的检索程序并自建网页数据库,搜索结果直接从自身的数据库中调用。一种是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎、sohu、sina等。以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息按照一定的主题进行分类,建立层次目录。大目录下面包含子目录,子目录下面又包含子目录,如此下去,建立具有包含关系的层次目录。收集的信息大多
7、面向网站,提供目录浏览服务。目录索引式搜索引擎单独型搜索引擎——主要是指搜索引擎之间没有嵌套,是独立的单一性搜索引擎。按包含的搜索工具的数量划分元搜索引擎——这类搜索引擎没有自己的数据库,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为结果返回给用户。服务方式为面向网页的全文检索。如:HOTBOT、搜星、WebCrawler、InfoMarket综合型搜索引擎按搜索的内容划分专业型搜索引擎特殊型搜索引擎只搜集某一行业或专业范围内的信息资源,只能检索到某一专
8、题的网址或网页。例如:美国化学工业专业搜索引擎、化工Yahoo、中国电力搜索引擎等。专业型搜索引擎名录搜索引擎——专门搜集有关电话、人名、地址图片搜索引擎——专门收集有关图像信息的MP3音乐搜索引擎——专门收集关于音乐Flash搜索引擎——专门收集Flash在线免费电影搜索引擎新闻搜索引擎特殊型搜索引擎目录检索——指通过分类的方式进行检索全文检索——对于网页进行基于全文的关键词检索精确检索:受控词表和XML(逻辑组配)自然语言检索:AskJeeves、GoTo、InQ
此文档下载收益归作者所有