网络营销基础03

网络营销基础03

ID:27456286

大小:11.47 MB

页数:97页

时间:2018-12-03

网络营销基础03_第1页
网络营销基础03_第2页
网络营销基础03_第3页
网络营销基础03_第4页
网络营销基础03_第5页
资源描述:

《网络营销基础03》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电商-2011级第三章搜索引擎营销石静娜2013年10月19日本课程主要内容第一节搜索引擎工作原理第二节搜索引擎营销概述第三节关键词分析第四节搜索引擎优化第五节搜索引擎广告第六节常用工具简介 第一节:搜索引擎工作原理搜索引擎的定义及分类搜索引擎是为网络用户提供信息查询服务的计算机系统,也可以说是一类提供信息“检索”服务的网站,它根据一定的策略、运用特定的方法搜集互联网上的信息,并对信息进行组织和处理,将处理后的信息通过计算机网络显示给用户。纯技术搜索引擎,如Google、AltaVista、

2、Inktomi、Baidu等,全文检索搜索引擎其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站分类目录式搜索引擎描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询,DMOZ是分类目录的典型代表。元搜索引擎是一种调用其它独立搜索引擎的引擎,元搜索引擎在元搜索引擎接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。开放式分类目录DMOZDMOZ简介DMOZ网站(

3、www.dmoz.org)是一个著名的开放式分类目录(OpenDirectoryProject),之所以称为开放式分类目录,是因为DMOZ不同于一般分类目录网站利用内部工作人员进行编辑的模式,而是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。提交DMOZ注意事项:ü选择合适的分类提交网站信息;ü高质量的网站内容;ü登录时机:经过充分测试无明显错误;ü提交网站信息要简明扼要,不要过多的描述性文字。ü不要多次对DMOZ重复提交搜索引擎工作原理搜索引擎工作的三阶段:爬行和抓取预处理排名7爬行和抓

4、取主流蜘蛛:序号搜索引擎“蜘蛛”名称序号搜索引擎“蜘蛛”名称1GoogleGooglebot5有道YoudaoBot2MSNmsnbot6搜狗Sogouwebspider3YahooYahoo!Slurp7搜搜Sosospider4百度Baiduspider8Bingbingbot爬行遍历策略:深度优先广度优先AAA1B1A1B1C1A2B2A2A3A4A3B3A4B4预处理1/31、提取文字•去除HTML、CSS、JavaScript、Flash、图片等代码及资源,提取文字2、中文分词•中文/n分词

5、/v指/v的/u是/v将/p一/m个/q汉字/n序列/n切分/v成/v一个/m一个/m单独/b的/u词/n。/w分词/v就/d是/v将/d连续/a的/u字 /n序列/n按照/p一定/b的/u规范/n重新/d组合/v成/v词序/n列/v的/u 过程/n。/w3、去停止词•去掉“的”、“啊”、“从而”等词预处理2/34、消除噪声对网站主题没有实质性帮助的元素•版权声明文字、页头、博客分类页面等导航内容、页脚、广告等噪声5、去重•对于不同网站或同一网站的重复内容进行删除•去重的基本方法是对页面特征关键词计算

6、指纹6、正向索引文件ID关键词文件1关键词1,关键词2,关键词5,关键词7,关键词9,…,关键词m文件2关键词2,关键词4,关键词7,关键词8,…,关键词n……文件n关键词1,关键词3,关键词5,关键词6,…,关键词k预处理3/37、倒排索引关键词文件ID关键词1文件1,文件2,文件5,文件7,文件9,…,文件m关键词2文件2,文件4,文件7,文件8,…,文件n……关键词n文件1,文件3,文件5,文件6,…,文件k8、链接关系计算•网页之间的链接流动信息:页面上的链接指向哪些页面、从哪些页面导入,锚文

7、本等9、特殊文件处理•PDF、Word、XLS、PPT、TXT等排名1、搜索词处理•中文分词、去停止词、指令处理、拼写错误校正2、文件匹配•将关键词的索引结果进行筛选、合并3、初始子集选择•百度返回76页4、相关性计算•关键词常用程度、词频及密度、关键词位置及形式、关键词举例、链接分析及页面权重等5、排名过滤及调整•主要是检查作弊6、排名显示•主要是meta标签7、搜索缓存•重复搜索的是缓存8、查询及点击日志•记录搜索用户的IP、关键词、搜索时间、点击页面链接原理:以PageRank为例PageRan

8、k是一种由搜索引擎根据网页之间相互的超链接关系计算网页级 别的技术,Google用它对网页的相关性和重要性作出评价。 PageRank技术并不是简单的计算直接链接的数量,而是把从A页面到B 页面的链接解释为A页面给B页面的投票,根据A页面的级别和链出的链接数 量来决定B页面的级别,一个页面的PageRank是由链向它的页面的数量和 重要性经过计算得到的。PR(A)=(1-d)+d(PR(B1)/C(B1)+...+PR(Bn)/C(Bn))其中,PR(A

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。