浅谈搜索引擎技术

浅谈搜索引擎技术

ID:6356939

大小:115.87 KB

页数:8页

时间:2018-01-11

浅谈搜索引擎技术_第1页
浅谈搜索引擎技术_第2页
浅谈搜索引擎技术_第3页
浅谈搜索引擎技术_第4页
浅谈搜索引擎技术_第5页
资源描述:

《浅谈搜索引擎技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、信息检索结课论文题目:对搜索引擎技术的探讨学  院:研究生学院专业:集成电路工程学生姓名:于政池学号:1302304006授课教师:李凤英对搜索引擎技术的探讨于政池(桂林电子科技大学信息与通信学院,广西桂林541004)摘要:随着互联网信息量成倍地增长,人们在浩瀚的网络中搜索出满足自己需求的信息就犹如大海捞针。而搜索引擎的出现使得这一难题基本得到解决。搜索引擎的作用在于通过搜集并整合来自互联网络的内容,从而帮助人们找到自己需要的资讯。该篇论文从搜索引擎的发展史出发,详细介绍了搜索引擎的组成及分类,并以Google和百度两大搜索引擎为例,简要介绍了他们的关键技术:包括Google的Pag

2、eRank技术、超文本匹配分析;百度的链接分析(LinkAnalysis)技术、SpellingChecker拼写检查技术。最后,从技术和用户体验的角度评价当前搜索引擎存在的问题,提出未来搜索引擎的发展方向。本文对搜索引擎技术的研究目的,旨在建立起搜索引擎的整个发展历史及关键技术的概念,为更深入的研究打下基础。关键词:搜索引擎关键技术Google百度DiscussthesearchenginetechnologyZhengchiYu(CollegeofCommunicationandInformationofGuilinuniversityofElectronicTechnology,

3、Guilin541004,Guangxi)Abstract:WiththegrowingofInternetInformationinmultiples,peoplesearchtheinformationtheyneedinthevastinternetjustlikeslookingforaneedleinahaystack.Whiletheemergeofsearchenginesolvesthedifficultproblem.Theroleofsearchengineistohelppeoplefindtheinformationtheyneedbycollectingand

4、integratingtheinternetinformation.Thepaperintroducesthecompositionandclassificationofthesearchengineindetailbasedontheintroductionofitsdevelopmenthistory.TakingthetwobigsearchenginesGoogleandBaiduasexamples,thepaperrecommendstheirkeytechnologies,includingGoogle'sPageRanktechnology,hypertextmatch

5、inganalysis,Baidu'sLinkAnalysistechnology,SpellingCheckertechnology.Intheend,thepaperputsforwardthedevelopmentdirectionoffuturesearchenginesbasedontheassessmentoftheproblemsexistingintechnologyanduserexperience.Theresearchobjectiveofthesearchengineistosetuptheconceptsofthewholedevelopmenthistory

6、andkeytechniquesofsearchengine,thuslayingthefoundationtothemuchdeeperresearch.Keywords:Searchengine,Keytechnology,Google,Baidu,1搜索引擎简介1.1搜索引擎的发展历程搜索引擎的发展历程大概分为三个阶段。第一个阶段:发展初期上世纪90年代初,互联网还没有普及,但通过互联网传输文件的行为已经相当普遍。由于文件分布在网络的各个FTP主机上,想要定位到某个文件并访问非常不方便。于是,一个美国大学生发明了一个自动索引FTP主机的工具Archie,用户通过输入文件名,便可通

7、过Archie索引到的文件名列表找到所需要的文件。Archie依靠脚本程序自动搜索网络上存在的文件,然后对文件名信息进行索引。Archie的局限在于只能对文件进行搜索,而无法对网页进行搜索。第二个阶段:起步时期由于互联网的逐步扩大,人们对网页抓取和新网站的发现产生了浓厚的兴趣,一种专门在网络间搜集信息的程序出现。由于程序在执行任务的过程中不需要人工干预,所以这种程序被称为“网络机器人”。后来的搜索引擎将这种程序改进并用来搜集网页上的信息,这种程

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。