《搜索引擎概述》PPT课件.ppt

《搜索引擎概述》PPT课件.ppt

ID:52086039

大小:3.59 MB

页数:51页

时间:2020-03-31

《搜索引擎概述》PPT课件.ppt_第1页
《搜索引擎概述》PPT课件.ppt_第2页
《搜索引擎概述》PPT课件.ppt_第3页
《搜索引擎概述》PPT课件.ppt_第4页
《搜索引擎概述》PPT课件.ppt_第5页
资源描述:

《《搜索引擎概述》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、目录SEO不等于作弊1SEO内容为王2SEO与SEM的关系3SEO与付费排名的关系4互联网调查报告显示:78%的网民通过搜索引擎这一方式查找自己所需的信息所以个人站长、企业网站管理者、大型网站的运营者,对搜索引擎的关注将成为日常工作的重点。搜索引擎中,用户的对搜索结果的关注度:搜索结果第1名------100%搜索结果第2名------100%搜索结果第3名------100%搜索结果第4名------85%搜索结果第5名------60%搜索结果第6名------50%搜索结果第7名------50%搜索结果第8名------3

2、0%搜索结果第9名------30%搜索结果第10名------20%很明显,只有排在前三名的关注度最高。通过百度,google搜索结果点击热点图可以得出同样的结果搜索引擎的工作原理1、页面收录2、页面分析3、建立索引4、页面排序搜索引擎-页面收录这个工作主要由叫做“机器人(googlerobot)”或者“蜘蛛(baiduspider)”的程序,根据一定规则扫描存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站。为保证采集的资料最新,它还会回访已抓取过的网页。这个工作是搜索引擎所有工作的基础页面

3、收录原理URL列表抓取页面提取URL存储原始页面进入搜索引擎URL列表的方法搜索引擎还允许用户自己提交网站(一般只需要提交首页或者网站域名即可)通过与别的网站建立链接关系即“外链”页面存储搜索引擎在存储原始页面时,不单只存储原始页面,还会存储其他的附加信息,例如:文件类型、文件大小、最后修改时间、URL、IP地址、抓取时间等搜索引擎-页面分析对页面内容进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等)对页面正文内容进行“切词”,为这些词建立索引,

4、得到页面和关键字之间的对应关系页面分析网页索引正文信息关键字列表关键词重组网页网页分析网页分析主要包括:正文信息提取:主要是对标签和注释等信息的过滤切词/分词:对页面内容进行切分,形成与用户查询条件相匹配的关键字为单位的信息列表匹配分词:和预设的海量词汇的“辞典”中的词比较,如果有匹配的词,则为命中统计分词:根据相邻的2个或者多个字(词)出现的概率判断这2个字(词)是否会形成一个词。搜索引擎-建立索引关键字索引:在切词处理后,形成了关键字列表。关键字列表的每条记录包含:关键字、关键字编号、出现次数、在网页中的位置信息等。根据一定的

5、相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库对抓取回来的网页建立索引,以实现对页面的快速定位;页面排序用户在搜索引擎中输入查询条件后,搜索引擎就在数据库中检索相关的信息,并将检索结果返回给用户搜索引擎在往用户端返回数据的时候,并不是随机的,而是按照一定的计算方法进行排序的涉及到排序的因素主要有:页面相关性链接权重用户行为页面排序-页面相关性页面相关性通过对检索结果进行相关性排序,搜索引擎的最终目的是将最相关的网络信息尽可能地优先显示在搜索结果

6、的前面部分,以改进搜索结果的输出。虽然各个搜索引擎中相关度排序的具体实现各不相同,但基本上都采用了基于网站内容的分析方法,即考虑用户所查询的关键词在文档网页中的出现情况,包括关键字匹配度、关键字频率、关键字密度、关键字位置、链接等因素。页面相关性关键字匹配度:是指网页中的内容与用户所查询关键字之间的匹配程度,主要是2个因素:页面中是否包含关键字关键字在页面中出现的次数关键字密度:关键字出现的次数与该网页总词汇量的比例页面相关性关键字分布:关键字在网页中出现的位置关键字在网页中出现的位置会影响到关键字的分布值关键字的权重标签关键字是

7、否使用了HTML标签实现了不同的视觉效果(如加粗、颜色变换等)页面相关性计算公式:R(relevance)=M(match)+D(density)+P(position)+T(htmlTag)R(相关性)=M(相同性)+D(密度)+P(位置)+T(HTML标签)链接页面之间的超链接反映了页面之间的引用关系,页面被其他站点或其他网页引用的次数基本上也反映了该网页的受欢迎程度或重要性。内部链接外部链接网页1网页3网页2用户行为用户行为主要包括:搜索:用户获得信息的过程,通过这个用户行为,学习新词汇,丰富辞典点击:用户对搜索结果的反应,

8、被点击的次数越多,说明越重要,权重越高为避免马太效应,对排在后面的链接的点击的权重补偿思考?1、搜索引擎遵循了什么样的排序标准?2、排在前面的网站是不是不会被挤下来?3、利用这些排名可以给网站运营带来什么好处?4、网站排名靠前是否就意味着运营成功?

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。