欢迎来到天天文库
浏览记录
ID:34517641
大小:181.00 KB
页数:3页
时间:2019-03-07
《搜索引擎技术的研究与展望》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、ISSN1009-3044E-mail:eduf@cccc.net.cnCCoommppuutteerrKKnnoowwlleeddggeeaannddTTeecchhnnoollooggyy电脑知识电脑知识与技术与技术第7卷第http://www3期(2011.dnzs.net.cn年1月)Vol.7,No.3,January2011,pp.636-637,647Tel:+86-551-56909635690964搜索引擎技术的研究与展望12谭营军,李翠霞(1.河南职业技术学院信息工程系,河南郑州450046;2.郑州大学软件学院,河南郑州450002)摘要:
2、该文首先介绍了搜索引擎的定义和功能,进而在对目前所存在问题进行分析的基础上,给出了进一步提高搜索引擎服务质量时所面临的研究课题。关键词:搜索;搜索引擎;索引器;检索器;挖掘器中图分类号:TP18文献标识码:A文章编号:1009-3044(2011)03-0636-02StudyandVistaoftheSearchEngineTechnologiesTANYing-jun1,LICui-xia2(1.DepartmentofInformationEngineering,HenanPolyTechnic,Zhengzhou450046,China;2.School
3、ofSoftware,ZhengzhouUniversity,Zhengzhou450002,China)Abstract:ThisPaperintroducesthedefinitionandfunctionsofsearchenginefirstly.Afterdiscussingtheproblemsofusingsearchengine,somestudypointsforimprovingtheservicequalityareprovided.Keywords:search;searchengine;indexer;retrieval;digger随
4、着科技的进步尤其是网络技术的发展,可用的信息资源集合出现了爆炸式的增长。存在于万维网上的信息可谓海量,但其结构却不够严谨。拥有海量信息的网络世界就像一本无所不包的百科全书。但由于无人编辑,人们可以随心所欲地向这本书提交任何信息,这样就导致了这本书的内容在组织上非常混乱。尽管它包含着极大的信息资源,但是针对每个人所需要的信息却相对匮乏。面对规模如此庞大的信息海洋,试图通过浏览Web网页来发现信息已经变得异常困难,往往花费大量的精力却所获甚少。因此,在Web用户和Web信息资源之间出现了巨大的鸿沟:一方面,Web资源中蕴含着极其丰富的有价值的信息和知识;另一方面,用
5、户却无法有效地获取这些信息和知识。因此,为了能够有效地组织和分析海量的Web信息资源,帮助Web用户方便地获取其需要的信息和知识,人们就要借助于搜索引擎,通过其对内容进行检索和分类,快速的获取自己所需要的信息。搜索引擎(SearchEngine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。作为一门综合性的计算机技术,搜索引擎涉及高性能网络存储计算、信息检索、自然语言处理、数据挖掘、信息抽取和人机界面等诸多计算机研究领域。搜索引擎的功能可以简单地描述为,根据用户输入的查询串,从所收录的网页中找到一
6、组与该查询串最相关得网页,并把这些网页的链接地址返回给该用户,供其点击浏览[1]。搜索引擎的基本原理表现为信息集合和需求集合的匹配。搜索引擎定期自动搜寻某些Web站点,采集关于这些站点上的各类信息,自动对这些资源进行理解、提取、组织和处理,然后将这些数据整合到数据库,并为用户提供以Web技术为基础的包括布尔检索、短语或词组检索和各种限制检索在内的自然语言检索,之后按相关度输出检索结果。搜索引擎的工作流程大致可以分为:第一,搜集信息。搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。从少数几个
7、网页开始,连到数据库上所有到其他网页的链接,就像日常生活中所说的“一传十,十传百”一样。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。第二,整理信息。搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要使用户不用重新翻查所有保存的信息而迅速找到所要的资料。第三,接受查询。用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎主要是以网页链接的形式提供的,通过这些链
8、接,用户便能到达含有自己
此文档下载收益归作者所有