欢迎来到天天文库
浏览记录
ID:49490434
大小:355.25 KB
页数:35页
时间:2020-02-06
《站内SEO之网站结构.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、站内SEO之网站结构仪器仪表——何非可目录一、优化网站结构达到的目的二、如何设计搜索引擎友好的网站结构三、蜘蛛陷阱四、物理及链接结构五、清晰导航六、子域名和目录七、禁止收录机制八、Nofollow的使用九、URL的设计(下次分享内容)一、优化网站结构达到的目的1、用户体验。2、收录。3、权重分配。4、锚文本。1、用户体验用户访问一个网站时,能很自然的点击访问到自已需要的内容。(用户的行为方式)1)良好的导航系统2)适时出现的内部链接3)准确的锚文本2、收录1)网站的收录在很大程度上依靠良好的网站结构。2)大中型网站往往会形
2、成一个异常复杂的链接结构。3)怎样使搜索引擎蜘蛛能顺利爬到所有内部页面(是一个很大的挑战)。3、权重分配除了外部链接可以给网页带来权重外,网站本身的结构和链接关系是内部页面权重分配的主要因素。4、锚文字锚文字是排名算的很重要一部分。怎么样做好锚文字?二、如何设计搜索引擎友好的网站结构1、搜索引擎蜘蛛能不能找到网页。2、找到网页后能不能抓取网页内容。3、抓取页面后怎样提炼有用的信息。1、搜索引擎蜘蛛能不能找到网页1)让搜索引擎蜘蛛发现首页2)通过首页内部链接找到更深的内容3)具有良好的内部结构,符合逻辑。4)使所有页面可通过
3、可爬行普通的HTML链接达到。5)JavaScript、Flash中的链接一般搜索引擎蜘蛛不能跟踪爬行。2、找到网页后能不能抓取网页内容被发现的URL必须是可被抓取的,要尽量避免以下的情况:1)数据库动态生成、带有大量参数的URL。2)SessionID、整个页面是Flash的。3)框架结构(frame)。4)大量的复杂内容等。3、抓取页面后怎样提炼有用的信息1)关键词在页面重要的位置合理分布2)重要标签的撰写3)HTML代码精简4)起码的兼容性等以上几条处理的好都能帮助搜索引擎理解页面内容,抓取有用信息。三、蜘蛛陷阱一些
4、网站设计技术对搜索引擎来说很不友好,不利于爬虫的爬行和抓取,这些技术称之为蜘蛛陷阱,常见的应该尽力避免的有以下这些:1、Flash2、SessionID3、各种跳转4、框架结构5、动态的URL6、JavaScript链接7、要求登陆8、强制使用Cookies1、Flash很小的一部分来增加视觉效果或者说来制做广告,不影响。整一个首页面一个大的Flash。2、SessionID(会话ID)有些网站SessionID跟踪用户,每一个用户访问网站时会产生一个独特唯一的SessionID,加在URL上。3、各种跳转除了301跳转外
5、,其它跳转对于搜索引擎来说都比较敏感,如302跳转、JavaScript转跳、Flash跳转、MetaRefresh跳转。4、框架结构对于搜索引擎来说,访问一个使用框架的网址所抓取的HTML只包含调用其它HTML文件的代码,并不包含任何文字信息,搜索引擎根本无法判断这个网址的内容是什么。5、动态的URL动态URL是指数据库驱动的网址所产生的、带有问号、等号及参数的网址。一般动态的URL不利于搜索引擎蜘蛛爬行,应该尽量避免。6、JavaScript链接1)用JavaScript生成航行系统。2)JavaScript链接还有特
6、殊用途。7、要求登陆8、强制使用Cookies四、物理及链接结构1、物理结构2、链接结构1、物理结构物理结构是指网站真实的目录及文件所在位置所决定的结构。扁平式结构(适合小型网站)树形结构或金子塔形结构2、链接结构网站结构的第二层意思就是链接结构,或称为逻辑结构,也就是网站内部链接构成的网络图。比较合理的链接结构通常是树型结构,如图:五、清晰导航1、文字导航2、点击距离及扁平化3、锚文字包含关键词4、面包屑导航5、避免页脚堆积六、子域名和目录1)子域名天生权重比目录高点。2)子域名不要随意乱用。3)以下情况用子域名更适当:
7、网站内容足够多,每一个子域名下都有大量内容,足以成为一个独立的网站而毫不逊色。大型公司特别是夸国公司,有不同国家的分部和分公司。分类信息网站,不同的城市用不同的子域名。平台类网站,如B2B和淘宝类商城。每个用户都有相对独立的展示平台,使用自已的子域名对品牌建设、推广都有好处。七、禁止收录机制用JavaScript、Flash链接、nofollow等方法都不能保证搜索引擎一定不会来收录你的页面。要确保页面不被收录,使用robots文件或者MetaRobots标签。robots文件User-agent:*Disallow:/这
8、个robots文件是禁止所有搜索引擎抓取任何内容。User-agent:指定下面规则适用那个蜘蛛。如:User-agent:Baiduspider(针对百度)User-agent:Googlebot(针对谷歌)Disallow:告诉蜘蛛不要抓取某些文件或目录。思考题:User-agent:Baidusp
此文档下载收益归作者所有