eo基础培训新浪厦门

eo基础培训新浪厦门

ID:45079692

大小:1.70 MB

页数:33页

时间:2019-11-09

eo基础培训新浪厦门_第1页
eo基础培训新浪厦门_第2页
eo基础培训新浪厦门_第3页
eo基础培训新浪厦门_第4页
eo基础培训新浪厦门_第5页
资源描述:

《eo基础培训新浪厦门》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、所谓SEO不了解搜索引擎工作原理,也就无从替搜索引擎解决一些SEOer力所能及的技术问题。当搜索引擎面对一个网站发现要处理的问题太多,难度太大时,搜索引擎可能就对这样的网站敬而远之了这里有一个概念“伪原创”,这个是很多SEOer所以津津乐道的一点。很多SEOer把别人的文章拿过来加一些“的”“地”“得”或者重新编排一下爱段落,以为这样就能骗过搜索引擎,达到内容原创的目的。。。这是完全不可行的,搜索引擎的重复原创算法是很先进的。“无搜索不生活”,搜索引擎的依赖性已经深深扎根与我们的日常生活中,每一个人都离不开搜索引擎!我们天天使用搜索引擎,但是对于这个搜索引擎的结果页面,我们又了解

2、多少呢?就算是没有触发百度的凤巢系统,很多情况下仍旧在搜索引擎的结果页面显示广告,作为有一定之SEO知识的人员当然会明白这二者的区别,但是对于普通用户,就完全不了解了。早期搜索“高血压”这类的词,出来的都是药品,假药的信息经典搜索列表红色高亮信息可以看出页面和关键词的相关性如何第一行:标题,取自网站TITLE(所以页面标题的写法,无论是对排名还是点击率都有重要意义)第二、三行:页面说明。页面说明有的时候取自页面中的说明标签,有时候是从可见内容文字中进行动态抓取。所以显示什么页面说明是用户查询是才决定的。第四行:来源网址,百度数据库中页面最后的更新日期,百度快照地址整合搜索结果主要

3、以新闻类为主,其他则较少见迷你全站链接基本上全站链接系列,只有百度自身的内容来源时才会出现。当用户搜索一个关键词的时候,这个网站的结果是最权威的内容来源时,除了显示正常结果页面,还会显示4个内页链接,称为全站链接One-box某些关键词会触发one-box结果,直接在搜索结果页面上显示相关信息。用户不用点击到其他网站上查看。如左图显示搜索“建设银行”显示的股价的one-box.富摘要除了搜索结果与链接之外,还用灰色的字给出了一些摘要的信息,以提升说明力搜索引擎工作过程可以分为爬行和抓取预处理排名爬行和抓取爬行和抓取是搜索引擎工作的第一步,完成数据收集的任务蜘蛛Spider搜索引擎

4、用来爬行和访问页面的程序被称为蜘蛛。蜘蛛访问网站页面和我们开网站一样,发起一个请求,服务器返回Html代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取速度,都使用多个蜘蛛并发分布爬行Robots.txt蜘蛛访问任何一个网站的时候,都会访问网站根目录下的robots.txt这个文件,如果这个文件设置了禁止搜索引擎抓取某些文件或目录。蜘蛛将遵守协议,不抓取被禁止的网址。跟踪链接深度优先遍历策略跟踪链接广度优先遍历策略理论上,不论是深度优先还是广度优先,只要给蜘蛛足够时间,都能爬完整个互联网,但是实际上受限于带宽资源,时间资源,蜘蛛只能抓取有限的页面。吸引蜘蛛由

5、于受限于实际情况,蜘蛛无法抓取所有页面,所以蜘蛛抓取的就是尽量抓取重要的页面。那什么样的页面是会认为比较重要的呢?网站的质量和权重质量高、资格老的网站被认为权重比较高,这种网站上的页面被爬行的深度也会比较高,所以会有更多内页被收录页面更新度蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样,说明页面没有更新,蜘蛛也没有必要经常抓取。如果页面内容经常更新,蜘蛛就会更加频繁地访问这种页面,页面上出现的新链接,也自然会被快速跟踪,抓取页面导入链接无论是外部链接还是同一个网站的内部链接,要被蜘蛛抓取就必须有导入链接进入页面,否则蜘蛛根本没有机会知道页面的存在

6、。高质量的导入链接也经常使页面上的导出链接被爬行深度增加。与首页点击距离一般来说网站上权重最高的是首页,大部分外部链接是指向首页,蜘蛛访问最频繁的也是首页。离首页点击越近,页面权重越高。被蜘蛛爬行的机会也越大预处理搜索引擎数据库中的页面数都在数万亿级别上,用户输入搜索词汇之后,如果临时运行程序分析页面得出结果,这个计算就太大了,不可能再一两秒内返回排名结果。所以抓取的一些页面就必须先进行预处理,为最后的排名最准备中文分词整合触发搜索某些关键词会触发整合搜索,比如明星的姓名就经常触发图片和视频内容,当前的热门话题又容易触发资讯内容。THANKS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。