搜索引擎技术及其优化策略

搜索引擎技术及其优化策略

ID:33943886

大小:438.49 KB

页数:6页

时间:2019-03-01

搜索引擎技术及其优化策略_第1页
搜索引擎技术及其优化策略_第2页
搜索引擎技术及其优化策略_第3页
搜索引擎技术及其优化策略_第4页
搜索引擎技术及其优化策略_第5页
资源描述:

《搜索引擎技术及其优化策略》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第24卷第2期2010年4月中国医学教育技术CHINAMEDICALEDUCJ钔【lION’rECHNOLOGYV01.24No.2Apr.2010·技术与教育·搜索引擎技术及其优化策略刘小鸿(第二军医大学教育技术中心,上海200433)【摘要】:搜索引擎优化是进行网站推广的重要方式。根据搜索引擎定义、倒排索引建立原理、PageRank算法要素,分析并介绍了通过网站的结构、关键字、链接、内容来进行搜索引擎优化;根据网站安全问题,提出了网站安全优化方案。指出在实践的应用中证明了该方案的有效性,为网站建设提供了有益

2、的SEO方法。【关键词】:搜索引擎;搜索引擎优化;PageRank算法;安全优化【中图分类号】:G434;TP393【文献标识码】:A【文章编号】:1004-5287(2010)02-0161-04SearchenginetechniqueandoptimizationtacticsL/uXiaohong(CenterofEducationalTechnology。SecondMilitaryMedicalUniversity,Shanghai200433,China)【Abstract】:Searchengineop

3、timization(SEO)isanimportantwayforwebsitepromotion.Basedonthedefinitionofsearchengine,principleofinvertedindex,andcalculationfactorofPageRankalgorithm,thepaperanalyzesanSEOstrategydevelopedthroughthewebsite§structure,keywordsllinksandcontent.Basedonwebsecuritypr

4、oblem,awebsiteoptimizationmethodisproposed.PracticehasprovedthatthisstrategyiseffectiveandcanprovidesomeusefulSEOmethodsforwebsiteconstruction.【Keywords】:searchengine;searchengineoptimization(SEO);PageRankalgorithm;securityoptimization搜索引擎优化(searchengineoptimiza

5、tion,SEO)是指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动等内容进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性¨引。随着互联网和Web技术的发展,网上的信息也越来越多。搜索引擎已成为互联网上进行信息获取的一种重要手段,越来越多的用户通过搜索引擎找到所需信息。通过搜索引擎的检索,客户可以很方便地从关注度排序列表中找到相关的资料和信息。用户通常只关心搜索引擎返回的排在前列的页面。为了提高网站的访问量,就要求网站在列表中占据较好的位置。因此,有必要对网站进行搜索优

6、化处理。1搜索引擎技术1.1搜索引擎定义搜索引擎是指在Internet上搜索信息并自动索引提供查询服务的一类工具,它主要通过网络搜索机器人WebRobots收集Internet信息,对其加工处理,建成供查询用的数据库,也称之为倒排索引。搜索引擎可被看作是一个对互联网和数据库中的信息资源进行搜集、整理、分类,并以一定的方式为用户提供检索服务的系统"J。搜索引擎一般是由信息采集模块、文档组织及索引模块、检索模块三部分组成:①信息采集模块负责从Internet上搜集网页信息;②文档组织和索引模块将搜集来的网页和相关描述信息进

7、行处理后,存储在索引数据库中,以备用户检索。处理过程主要包括文档特征提取、相关度分析、网页筛选、归类和入库;③检索模块是搜索引擎和用户之间的接口。它根据用户的查询要求,访问倒排索引数据库,根据搜索引擎排名算法获得检索结果,并按相关度大小将结果反馈给用户。1.2Web文本预处理收稿日期.'2009-1l-16作者简介:刘小鸿(1978-),男,福建泉州人,讲师,教育技术学士,主要研究方向:影视媒体制作与应用研究,网络媒体制作等。万方数据162中国医学教育技术第24卷第2期用户读取Web页面后,将相关信息存储下来,实际上就

8、是对Web页面对应的html文档进行处理。由于作为Web页保存下来的html格式,除了标题、正文部分外,还包含许多html的控制命令。要实现信息处理,需要过滤许多无用信息。因此,将html文档转化为txt(纯文本)文件,就是web信息预处理所要解决的问题。将html文档转化为txt文档,主要是提取出html文档中的五种信息H1:①

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。