欢迎来到天天文库
浏览记录
ID:33943886
大小:438.49 KB
页数:6页
时间:2019-03-01
《搜索引擎技术及其优化策略》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、万方数据第24卷第2期2010年4月中国医学教育技术CHINAMEDICALEDUCJ钔【lION’rECHNOLOGYV01.24No.2Apr.2010·技术与教育·搜索引擎技术及其优化策略刘小鸿(第二军医大学教育技术中心,上海200433)【摘要】:搜索引擎优化是进行网站推广的重要方式。根据搜索引擎定义、倒排索引建立原理、PageRank算法要素,分析并介绍了通过网站的结构、关键字、链接、内容来进行搜索引擎优化;根据网站安全问题,提出了网站安全优化方案。指出在实践的应用中证明了该方案的有效性,为网站建设提供了有益
2、的SEO方法。【关键词】:搜索引擎;搜索引擎优化;PageRank算法;安全优化【中图分类号】:G434;TP393【文献标识码】:A【文章编号】:1004-5287(2010)02-0161-04SearchenginetechniqueandoptimizationtacticsL/uXiaohong(CenterofEducationalTechnology。SecondMilitaryMedicalUniversity,Shanghai200433,China)【Abstract】:Searchengineop
3、timization(SEO)isanimportantwayforwebsitepromotion.Basedonthedefinitionofsearchengine,principleofinvertedindex,andcalculationfactorofPageRankalgorithm,thepaperanalyzesanSEOstrategydevelopedthroughthewebsite§structure,keywordsllinksandcontent.Basedonwebsecuritypr
4、oblem,awebsiteoptimizationmethodisproposed.PracticehasprovedthatthisstrategyiseffectiveandcanprovidesomeusefulSEOmethodsforwebsiteconstruction.【Keywords】:searchengine;searchengineoptimization(SEO);PageRankalgorithm;securityoptimization搜索引擎优化(searchengineoptimiza
5、tion,SEO)是指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动等内容进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性¨引。随着互联网和Web技术的发展,网上的信息也越来越多。搜索引擎已成为互联网上进行信息获取的一种重要手段,越来越多的用户通过搜索引擎找到所需信息。通过搜索引擎的检索,客户可以很方便地从关注度排序列表中找到相关的资料和信息。用户通常只关心搜索引擎返回的排在前列的页面。为了提高网站的访问量,就要求网站在列表中占据较好的位置。因此,有必要对网站进行搜索优
6、化处理。1搜索引擎技术1.1搜索引擎定义搜索引擎是指在Internet上搜索信息并自动索引提供查询服务的一类工具,它主要通过网络搜索机器人WebRobots收集Internet信息,对其加工处理,建成供查询用的数据库,也称之为倒排索引。搜索引擎可被看作是一个对互联网和数据库中的信息资源进行搜集、整理、分类,并以一定的方式为用户提供检索服务的系统"J。搜索引擎一般是由信息采集模块、文档组织及索引模块、检索模块三部分组成:①信息采集模块负责从Internet上搜集网页信息;②文档组织和索引模块将搜集来的网页和相关描述信息进
7、行处理后,存储在索引数据库中,以备用户检索。处理过程主要包括文档特征提取、相关度分析、网页筛选、归类和入库;③检索模块是搜索引擎和用户之间的接口。它根据用户的查询要求,访问倒排索引数据库,根据搜索引擎排名算法获得检索结果,并按相关度大小将结果反馈给用户。1.2Web文本预处理收稿日期.'2009-1l-16作者简介:刘小鸿(1978-),男,福建泉州人,讲师,教育技术学士,主要研究方向:影视媒体制作与应用研究,网络媒体制作等。万方数据162中国医学教育技术第24卷第2期用户读取Web页面后,将相关信息存储下来,实际上就
8、是对Web页面对应的html文档进行处理。由于作为Web页保存下来的html格式,除了标题、正文部分外,还包含许多html的控制命令。要实现信息处理,需要过滤许多无用信息。因此,将html文档转化为txt(纯文本)文件,就是web信息预处理所要解决的问题。将html文档转化为txt文档,主要是提取出html文档中的五种信息H1:①
此文档下载收益归作者所有