欢迎来到天天文库
浏览记录
ID:6135961
大小:46.00 KB
页数:11页
时间:2018-01-04
《网络营销教程—seo 第10章 seo工作实践(下)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、网络营销教程—SEO第10章SEO工作实践(下)张栋伟
2、营销理论
3、出处:原创-IT
4、2008年12月03日13:41
5、阅读140次网络营销教程—SEO第10章SEO工作实践-网站的技术准备张栋伟 二遵循W3C规范W3C是英文WorldWideWebConsortium的缩写,中文意思是W3C理事会或万维网联盟。W3C于1994年10月在麻省理工学院计算机科学实验室成立。创建者是万维网的发明者TimBerners-Lee。W3C组织是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制。W3C会员(大约500名会员)包括生产技术产品及服务的厂商、
6、内容供应商、团体用户、研究实验室、标准制定机构和政府部门,一起协同工作,致力在万维网发展方向上达成共识。对于seo工作者对w3c的认识主要体现在对html,xhtml,xml语言标签代码的语义化认识上。本书的读者要力争做到对每个标签的作用含义心中有数,甚至可以手写代码。具体请参考网页制作等相关教程,不在本书讨论范围。 三网站地图1html网站地图Html网站地图是一种构建思路。也是链接构建技术。Html地图是沟通网站主要栏目之间的桥梁。起着引导浏览者和促进爬虫程序遍历全站的作用。如果,地图链接入口过多,应该保持每张地图不超过100个链接入口。例如天极网的html地图http://www
7、.yesky.com/sitemap.html (图10-2)对于天极来说,网站地图有指向频道页及下级分类页的文本链接就足够了,更重要的是让用户很清楚的了解到天极能提供什么以及天极的特色在哪里;对于中型站点来说,仍建议在网站地图中加入内容页的文字链接,可以通过技术手段生成以文章关键词搭配文章标题为锚文本的文字链接网站地图,并且用程序控制链接数量并自动分页。2谷歌网站地图Google地图跟html地图作用不同,他是完全面对搜索引擎而制作的网站地图。Google地图基于xml技术。Google地图全称是GoogleSitemaps是Google的一个和网站管理员相关的工具,建立Google
8、Sitemaps可以有效的促进google对网站页面的收录。现在google地图已经被各个网站广泛使用。在线生成GoogleSitemaps网址http://www.xml-sitemaps.com/四robots.txtRobots是搜索引擎的爬虫程序通告(爬行器通告)。对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是TheRobotsMETA标签。1、什么是robots.txt?robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被rob
9、ots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取。robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。网站URL相应的robots.txt的URLhttp://www.w3.org/http://www.w3.org/robots.txthttp://www.w3.org:80/http://www.w3.org:8
10、0/robots.txthttp://www.w3.org:1234/http://www.w3.org:1234/robots.txthttp://w3.org/http://w3.org/robots.txt 2、robots.txt的语法"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL,orNL作为结束符),每一条记录的格式如下所示: ":"。在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User
11、-agent开始,后面加上若干Disallow行,详细情况如下:User-agent:该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。Disallow:该项的值用
此文档下载收益归作者所有